Zetizen-Kalau dengar kata science, pasti yang terlintas di pikiran kamu adalah bidang ilmu pengetahuan yang berhubungan sama makhluk hidup, kimia, dan fisika. Namun, tahu nggak kalau data itu juga termasuk dalam science lho! Nah, pekerjaan yang satu ini bergelar scientist di bidang data. Yaps! Mereka adalah data scientist. Ngapain aja sih data scientist itu? Biar makin paham, yuk kita simak penjelasan dari dua data scientist berikut. (elv/c12/lai)
”Menurut aku, pekerjaan data scientist itu memanfaatkan data analytic untuk memberikan business value kepada perusahaan. Biasanya business value ini bisa berupa actionable insight atau informasi yang berguna untuk membantu perusahaan membuat keputusan. Misalnya, dengan data pesanan, seorang data scientist bisa membuat sistem rekomendasi produk untuk meningkatkan penghasilan. Yang membuat data scientist menarik adalah pengaruhnya yang bisa diterapkan di hampir semua bidang, mulai marketing, customer, gudang, risk dan fraud, sampai pengambilan keputusan.
Seorang data scientist wajib paham mengenai ilmu komputer, matematika, dan statistik. Selain itu, ada beberapa tambahan seperti komunikasi dengan user, visualisasi data, dan kalkulus. Biasanya, jurusan yang mendukung bidang ini adalah ilmu komputer, statistika, dan matematika. Meski begitu, jurusan lain juga bisa jadi data scientist kok.
Karena pekerjaan data scientist sangat ramai di skala global, profesi ini tentunya punya prospek yang baik ke depan dan sangat menjanjikan. Nggak hanya memproses data supaya bisa menghasilkan sesuatu yang bermanfaat aja, banyak ide baru yang bisa anak muda hasilkan lewat data science. Oleh karena itu, kamu harus selalu update dengan hal baru dan semangat mempelajari teknik-teknik terbaru.”
”Data scientist sudah menjadi sorotan publik sejak beberapa tahun terakhir, terutama sejak munculnya AI (artificial intelligence) pada revolusi Industri 4.0. Kalau kamu pernah dengar istilah data analyst, itu sebenarnya berbeda dengan data scientist. Keduanya sama-sama mengolah data, tapi kalau data scientist memproses data untuk menghasilkan sebuah prediksi di masa depan, sedangkan data analyst menggunakan data untuk membuat laporan sehingga data lebih mudah dimengerti.
Menjadi data scientist itu perlu memiliki pengetahuan tentang bisnis dan kegiatan operasional tertentu. Misalnya, data di perusahaan perbankan perlu mengetahui bisnis di dalamnya. Penguasaan terhadap bahasa pemrograman seperti R, Python, atau Scala sangat membantu pekerjaan data scientist sehari-hari. Apalagi, kalau ditunjang sama kemampuan SQL untuk mengolah data dari warehouse.
Sewaktu dulu bekerja, awalnya cukup berat karena aku belum mengenal machine learning, cuma tahu sedikit tentang bahasa pemrograman. Beruntung bisa mengikuti program trainee dan belajar banyak dari mentor dan teman-teman. Biasanya beberapa tantangan yang dihadapi itu ketika script yang dijalankan banyak yang terjadi error. Hal ini biasanya diselesaikan dengan mencari jawabannya melalui internet maupun rekan kerja tim. Kemauan belajar dan tidak malu untuk bertanya bisa jadi kunci untuk melewati kesulitan. Karena itu, kalau kamu belum kenal sama bidang ini, jangan khawatir! Kamu pasti bisa asal mau belajar.”
Zetizen-Secara umum, data scientist membantu pengambilan keputusan berdasar data dan informasi penting di dalamnya. Data tersebut diolah dan dianalisis dengan algoritma tertentu untuk menghasilkan solusi yang imajinatif untuk suatu permasalahan. Nah, job description dari data scientist dibagi berdasar CRISP-DM (cross-industry standard process for data mining) ke dalam enam tahapan berikut. (elv/c12/lai)
Proses yang pertama ini merupakan bagian yang cukup penting. Tahapan ini digunakan untuk memahami apa yang bisnis perlukan, menemukan akar permasalahan, dan menentukan matriks kesuksesan yang akan digunakan.
Secara garis besar, tahapan ini adalah memeriksa data dan membuat summary. Data yang sudah ada dipahami untuk mencapai tujuan bisnis dan mengecek data apa yang kita sudah punya. Tahap ini harus dilakukan secara cermat agar memberikan fondasi dalam penelitian.
Di tahap ini, data disiapkan untuk proses modeling. Masalah yang ada dalam data juga diperbaiki dan mencakup pembersihan data serta feature engineering. Ketika data sudah siap, nanti diteruskan ke tahap modeling.
Modeling merupakan tahap penentuan teknik apa yang dapat digunakan untuk memodelkan data. Umumnya, dibuat model prediktif dan deskriptif dengan metode statistika dan machine learning.
Proses ini adalah memilih modeling mana yang paling cocok dengan tujuan bisnis. Hasil dari data yang dihasilkan modeling dievaluasi agar tetap sesuai dengan tujuan yang mau dicapai di tahap pertama.
Model data yang selesai akan dikirimkan ke user atau stakeholder dalam perusahaan. Data divisualisasi agar lebih mudah dikomunikasikan kepada user. Karena model yang bisa terus berubah, data scientist akan memonitor dan meng-update model data secara berkala.