Computer Vision adalah cabang ilmu yang menggabungkan science dan technology untuk memungkinkan mesin, seperti komputer, memiliki kemampuan layaknya penglihatan manusia.
Dalam era digital saat ini, computer vision atau visi komputer menjadi salah satu cabang terpenting dari kecerdasan buatan (AI) yang merevolusi berbagai bidang, mulai dari pengenalan wajah hingga kendaraan otonom. Artikel ini akan membahas secara detail tentang pengertian computer vision, penerapan computer vison, serta manfaatnya dalam berbagai bidang.
Apa Itu Computer Vision?
Secara sederhana, computer vision adalah cabang ilmu yang merupakan gabungan dari science dan technology yang memungkinkan suatu mesin (computer) dapat “melihat” “memproses” dan “memahami” gambar atau video seperti yang dilakukan oleh manusia.
Tujuan Computer vision untuk mengidentifikasi, mengolah, dan menganalisis gambar serta data visual lainnya adalah untuk membuat keputusan atau memberikan wawasan yang berguna.
Compter Vision dapat diibaratkan sebagai pengelihatan kita terhadap sebuah gambar pemandangan didepan kita. Dimana disaat itu kita akan berfikir tentang beberapa hal seperti bagaimana cuaca saat ini? Dimana letak suatu pohon? Seberapa jauh jarak pohon dengan posisi kita berdiri. Begitulah kurang lebih bagaimana computer vision bekerja untuk mencari informasi dari suatu gambar.
Fokus utama Computer Vision sendiri adalah pengembangan suatu teori dan prinsip-prinsip untuk menciptakan sistem buatan (artificial systems) menggunakan algoritma dan model pembelajaran mesin yang dapat mengambil informasi dari gambar atau video.
Biasanya sumber data yang dapat digunakan dalam computer vision dapat berasal dari Rekaman Video (Video sequence), gambar yang memuat informasi kedalaman atau jarak objek (Depth images), gambar dari berbagai sudut camera (Views from multiple cameras), atau data dari berbagai alat Kesehatan sepeti CT Scan atau MRI.
Komponen dalam Computer Vision
Dalam computer vision terdapat beberapa component yang berperan penting dalam proses kerja sistem ini
Computer (Mesin)
Berfungsi sebagai otak dari sistem untuk memproses data visual menggunakan algoritma dan perangkat lunak tertentu
Camera
Mengcapture, mengakusisi atau menangkap citra atau video dari lingkungan sekitar sebagai sumber data visual
Gambar
Gambar merupakan citra digital hasil tangkapan kamera yang digunakan untuk training dan dianalisis oleh sistem.
Ketiga komponen ini bekerja secara terintegrasi untuk memungkinkan mesin dapat “melihat” dan memahami objek atau lingkungan seperti manusia.
Poin-Poin Penting yang Perlu Dipahami tentang Computer Vision
Untuk memperdalam pemahaman mengenai visi komputer, berikut adalah beberapa aspek penting yang menjadi fondasi teknologi ini:
Computer Vision Dicapai dengan Menggunakan Sejumlah Besar Dataset Gambar. Dataset gambar ini kemudian digunakan dalam melakukan pelatihan model dalam computer vision. Model dibangun dengan menggunakan teknik pembelajaran mendalam (deep learning) dimana gambar akan dipisahkan dengan system labelling. Gambar berlabel digunakan sebagai dasar untuk mengajarkan komputer mengenali berbagai pola dan objek untuk menghasilkan Keputusan tertentu.
Baca Juga : Apa itu Gemini AI
Penerapan Computer Vision AI
Saat ini teknologi computer vision telah berkembang pesat untuk mendukung berbagai pekerjaan pendukung keamanan system, penelitian dan Kesehatan berikut ini beberapa penerapan dari Computer Vision
Klasifikasi Gambar (Image Classification)
Klasifikasi gambar atau image classification adalah bentuk dasar computer vision di mana model dilatih dengan gambar yang sudah diberi label spesifik. klasifikasi Gambar umumnya hanya mengenali jenis objek saja namun belum bisa mendeteksi lokasi spesifik objek dalam gambar
Model belajar mengidentifikasi subjek utama dalam gambar dan kemudian mampu memprediksi label ketika diberikan gambar tanpa label.
Contoh Aplikasi : model dapat belajar bahwa sebuah gambar berisi “ikan” dan ketika diuji dengan gambar baru, model dapat mengklasifikasikan gambar tersebut sebagai ikan.

Sumber : mathworks.com
Optical Character Recognition (OCR)
Optical Character Recognition (OCR) adalah sebuah teknologi yang mampu mengonversi dokumen hasil pemindaian (scan) menjadi teks digital. Teknologi OCR umumnya digunakan pada perangkat pemindai (scanner) yang dilengkapi dengan perangkat lunak OCR.
Contoh Aplikasi : Salah satu contoh sistem OCR yang populer adalah sistem pembaca gambar plat nomor kendaraan, di mana informasi dari gambar plat nomor dapat diubah secara otomatis menjadi bentuk teks untuk keperluan identifikasi dan pendataan.

Sumber : mathworks.com
Face Detection
Face detection (deteksi wajah) adalah teknologi computer vision yang dapat digunakan untuk mendeteksi keberadaan wajah manusia dalam gambar atau video. Face detection mampu menemukan posisi dan ukuran wajah tanpa mengenali identitasnya.

Sumber : mathworks.com
Smile Detection
Teknologi face detection ini kemudian berkembang menjadi Smile Detection, yang memungkinkan sistem mengenali ekspresi senyuman pada wajah. Selain smile detection berbagai perkembangan teknologi face detection antaranya adalah face expression recognition, age detection, emotion detection dan gender detection.

Sumber : mathworks.com
Deteksi Objek (Object Detection)
Berbeda dengan klasifikasi gambar (image classification), yang hanya mengenali jenis objek, deteksi objek mengidentifikasi lokasi spesifik objek dalam gambar. Lokasi yang spesifik ini memungkinkan system untuk dapat mendukung berbagai aplikasi system keamanan.
Model dilatih untuk menggambar “kotak pembatas” di sekitar objek yang dikenali dalam sebuah gambar. Ini sangat penting dalam aplikasi seperti keamanan video, pengawasan, dan kendaraan otonom.
Contoh Aplikasi : Teknologi object recognition yang digunakan di supermarket bekerja dengan memanfaatkan kamera, sensor, dan kecerdasan buatan (AI) untuk mengenali dan mengidentifikasi barang secara otomatis, tanpa perlu interaksi manual dari kasir. Sistem ini umum digunakan dalam konsep kasir otomatis (checkout automation) seperti yang diterapkan pada toko-toko modern atau tanpa kasir (unmanned stores), misalnya Amazon Go

Sumber : mathworks.com
Vision-based Biometrics
Vision-based biometrics adalah teknologi pengenalan identitas yang menggunakan citra visual dari bagian tubuh manusia untuk autentikasi. Sistem ini bekerja dengan mendeteksi, mengenali, dan mencocokkan pola visual unik.
Contoh Aplikasi :
- Wajah (face recognition)
- Iris mata (iris recognition)
- Sidik jari (fingerprint recognition)
- Gerakan tubuh atau gaya berjalan (gait recognition)

Vision in space
Vision in space adalah penggunaan computer vision dalam eksplorasi luar angkasa. Vision in space seringkali dgunakan untuk mengetahui Navigasi otomatis satelit atau wahana Antariksa, Pengawasan kondisi luar angkasa secara visual, Deteksi dan pelacakan objek di orbit
Contoh Aplikasi:
- Navigasi dan Penghindaran Rintangan, Computer Vision digunakan pada rover Mars seperti MER (Mars Exploration Rover) untuk navigasi otonom. Dengan menggunakan kamera stereo, rover dapat mendeteksi rintangan secara real-time dan menentukan jalur aman secara mandiri tanpa campur tangan manusia dari Bumi.
- Computer Vision digunakan untuk membangun model 3D permukaan planet dari citra stereo. Teknologi ini membantu dalam menganalisis bentuk medan dan topografi Mars.
Vision-based Interaction (and games)
Teknologi ini memungkinkan manusia berinteraksi dengan sistem komputer melalui gerakan tubuh, ekspresi wajah, atau isyarat visual. Augmented Reality (AR) Games yang merespons posisi dan ekspresi wajah pemain secara real-time.
Industrial robots
Robot industri berbasis vision system menggunakan kamera dan algoritma computer vision untuk
Contoh Aplikasi
- Mengidentifikasi objek di jalur produksi
- Melakukan kontrol kualitas produk
- Memandu lengan robot untuk merakit atau memindahkan barang
Medical imaging
Medical imaging adalah penggunaan computer vision dalam bidang medis untuk mengetahui suatu penyakit atau kelaian tertentu. Computer vision mampu menganalisis gambar hasil pemindaian medis seperti X-ray, CT scan, MRI, dan ultrasonografi. Bahkan mendeteksi kelainan atau penyakit secara otomatis dari gambar medis.
Contoh Aplikasi:
- Deteksi dini kanker melalui mammografi.
- Identifikasi kerusakan jaringan otak dari hasil MRI.
- Pemantauan pertumbuhan janin dari citra USG.

Sumber : mathworks.com
Segmentasi Semantik
Segmentasi semantic adalah bentuk visi komputer yang lebih canggih dibandingkan deteksi objek. Alih-alih hanya menunjukkan lokasi objek dalam kotak, segmentasi semantik dapat mengidentifikasi setiap piksel dalam gambar yang termasuk dalam objek tertentu.
Dengan kemampuan ini, komputer dapat memahami gambar dengan tingkat detail yang lebih tinggi. Contohnya, dalam analisis citra medis, segmentasi semantik dapat membantu membedakan jaringan sehat dan jaringan yang terkena penyakit.
Contoh Aplikasi:
- Sistem navigasi kendaraan otonom (self-driving car) yang membutuhkan pemahaman lingkungan sekitar secara detail
- Sistem pengenalan objek untuk surveilans, pengawasan satwa liar, dan klasifikasi citra dalam bidang pertanian atau lingkungan

Sumber : mathworks.com
Penggabungan Visi Komputer dan Model Bahasa
Perkembangan terbaru dalam AI memungkinkan penggabungan teknik komputer vision dengan model bahasa untuk membuat model multi-modal.
Model ini dapat menggabungkan kemampuan penglihatan dengan kemampuan AI generatif untuk memahami dan menghasilkan konten berdasarkan input visual dan teks.
Contoh penerapan adalah model AI yang dapat melihat gambar dan kemudian menjelaskan isi gambar menggunakan bahasa alami.
Baca Juga : Apa itu Machine Learning?
Keahlian yang Diperlukan dalam Implementasi Computer Vision
Dalam implementasinya, Computer Vision tidak hanya menuntut pemahaman terhadap konsep visual dan algoritma, tetapi juga mengharuskan penguasaan terhadap berbagai bidang keahlian teknis. Beberapa di antaranya adalah kemampuan dalam bahasa pemrograman seperti C/C++, Java, atau MATLAB, yang sangat penting dalam membangun dan menguji sistem pengolahan citra digital.
Selain itu, diperlukan pemahaman yang kuat dalam aljabar linier, kalkulus dasar (basic calculus), probabilitas, serta ilmu statistik, karena bidang-bidang ini merupakan fondasi matematis dari algoritma machine learning dan pemrosesan gambar. Pengetahuan ini membantu dalam merancang model deteksi, klasifikasi, hingga segmentasi objek dalam gambar secara efektif.
Kemampuan tersebut akan sangat menunjang dalam pengembangan aplikasi Computer Vision di berbagai sektor, mulai dari medis, industri, keamanan, hingga teknologi kendaraan otonom
Mengapa Computer Vision Penting?
Computer Vision memainkan peran krusial dalam berbagai aspek kehidupan modern karena kemampuannya untuk memproses, memahami, dan mengekstraksi informasi dari data visual secara otomatis. Berikut adalah alasan utamanya:
- Safety (Keamanan Fisik):
- Membantu sistem kendaraan otonom mengenali rambu, pejalan kaki, atau potensi kecelakaan.
- Meningkatkan keselamatan transportasi melalui deteksi dini bahaya.
- Health (Kesehatan):
- Digunakan dalam analisis citra medis (seperti mammografi, MRI, CT Scan) untuk mendeteksi penyakit secara dini dan akurat.
- Security (Keamanan Publik):
- Mendeteksi dan mengenali wajah di area publik untuk identifikasi kriminal.
- Memantau aktivitas mencurigakan melalui CCTV dengan sistem AI otomatis.
- Comfort (Kenyamanan):
- Mengotomatiskan tugas sehari-hari seperti smart home yang mampu mengenali pengguna atau kebiasaan mereka.
- Fun (Hiburan):
- Digunakan dalam game berbasis gerakan atau ekspresi wajah (misalnya Kinect, AR game) untuk pengalaman bermain yang lebih interaktif.
- Access (Aksesibilitas):
- Membantu pengguna mengakses informasi dari gambar, teks, atau lingkungan (misalnya OCR untuk tuna netra, visual search di e-commerce).
FAQ
Berikut adalah beberapa FAQ mengenai Computer Vision
Computer Vision adalah cabang dari kecerdasan buatan (AI) yang memungkinkan komputer untuk “melihat”, memproses, dan memahami gambar atau video layaknya manusia. Di era digital, teknologi ini sangat penting karena diterapkan dalam berbagai sektor seperti keamanan, kesehatan, industri, kendaraan otonom, hingga aplikasi sehari-hari seperti pengenalan wajah di smartphone.
Beberapa contoh penerapannya antara lain:
1. Face detection di kamera ponsel
2. OCR untuk mengubah dokumen cetak menjadi teks digital
3. Sistem checkout otomatis di supermarket seperti Amazon Go
4. Diagnostik medis berbasis citra (X-ray, MRI)
5. Navigasi robot industri atau rover luar angkasa seperti Mars Rover
6. Pengawasan keamanan berbasis deteksi objek dan wajah
Image classification hanya mengidentifikasi jenis objek dalam gambar.
Object detection mengenali dan menentukan posisi objek secara spesifik dalam gambar dengan menggunakan kotak pembatas.
Semantic segmentation lebih canggih, karena mampu memberi label pada setiap piksel dalam gambar, memungkinkan sistem memahami objek dengan sangat detail
Kesimpulan
Teknologi computer vision merupakan bidang yang sangat penting dan berpotensi besar dalam transformasi digital masa depan. Dengan penggunaan data gambar yang sangat banyak, teknologi ini bisa mengklasifikasikan, mendeteksi, dan memahami objek dalam gambar dengan tingkat akurasi tinggi. Inovasi terbaru dengan menggabungkan computer vision dengan kecerdasan bahasa menandai era baru kemampuan AI multi-modal.
Selain itu, computer vision syndrome mengingatkan kita akan pentingnya menjaga kesehatan mata di tengah penggunaan teknologi yang semakin intensif.
Dengan pemahaman yang mendalam tentang apa itu computer vision dan penerapannya, kita dapat lebih siap menghadapi dan memanfaatkan transformasi teknologi yang terus berkembang.
Referensi
Moin, Tanvir. (2023). Overview of Computer Vision. 10.13140/RG.2.2.13989.68327.
Seetharaman, Dr. K. & Ragupathy, R.. (2012). Iris Recognition based Image Authentication. International Journal of Computer Applications. 44. 1-8. 10.5120/6272-8434.
Jonsson, Ari & Morris, Robert & Pedersen, Liam. (2007). Autonomy in Space Exploration: Current Capabilities and Future Challenges. IEEE Aerospace Conference Proceedings. 1-12. 10.1109/AERO.2007.352852.
Penulis : Meilina Eka A








