Veri Bilimcisi ile Veri Mühendisi Arasındaki Fark

Yazar: Güliz Başak Özkan

Veri Bilimcisi ve Veri Mühendisi yeni birer ünvan olarak algılanmasına rağmen aslında yerine getirdikleri sorumluluklar bir süredir vardır. Genellikle verileri analiz eden kişilere “veri analisti”, veri analizini desteklemek için arka uç platformları oluşturanlara ise “İş Zekâsı (BI) Geliştiricisi” denir. Büyük Veri’nin ortaya çıkmasıyla birlikte kurumlarda ve araştırma merkezlerinde veri bilimcileri ve veri mühendisleri gibi yeni roller de oluşmaya başladı.

Eğer bu dört ünvanın sorumluluklarını merak ediyorsan aşağıya göz atabilirsin:

1. Veri Analisti

Veri analistleri, kurumlarında veri sorgulayabilen ve işleyebilen, raporlar sunan, verileri özetleyen ve görselleştirebilen deneyimli veri uzmanlarıdır. Bir sorunu çözmek için mevcut araç ve yöntemlerden nasıl yararlanılacağına dair güçlü bir anlayışa sahiptirler, şirket genelindeki kişilerin geçici raporlar ve çizelgelerle spesifik sorguları anlamalarına yardımcı olurlar. Bununla birlikte, büyük verinin analiziyle uğraşmaları veya belirli problemlere yeni algoritmalar geliştirmek için matematiksel veya araştırma geçmişlerine sahip olmaları beklenmemektedir.

Becerileri: İstatistik, veri akışı, veri görselleştirme, keşifsel veri analizi gibi bazı temel becerilerde bilgili olmaları beklenmektedir.

Kullandıkları Araçlar: Microsoft Excel, SPSS, SPSS Modelleyici, SAS, SAS Madenci, SQL, Microsoft Access, Tableau, SSAS.

2. İş Zekası Geliştiricileri

İş zekası geliştiricileri raporlama ihtiyaçlarını anlamak ve şirket için iş zekası ve raporlama çözümleri oluşturmak, gereksinimlerini toplamak, tasarlamak ve oluşturmak için iç paydaşlarla daha yakından etkileşimde bulunan veri uzmanlarıdır. Yeni ve mevcut veri ambarlarını, ETL paketlerini, küpleri, gösterge tablolarını ve analitik raporları tasarlamak, geliştirmek ve desteklemek zorundadırlar.

Ek olarak hem ilişkisel hem de çok boyutlu veri tabanları ile çalışırlar ve farklı kaynaklardan gelen verileri entegre etmek için SQL geliştirme becerilerine sahip olmalıdırlar. Tüm bu becerileri, kurum genelinde self servis ihtiyaçlarını karşılamak için kullanırlar. İş zekâsı geliştiricilerinin genellikle veri analizi yapması beklenmemektedir.

Becerileri: ETL, rapor oluşturma, OLAP, küpler, web zekâsı, iş nesneleri tasarımı.

Kullandıkları Araçlar: Tablo, gösterge tablosu araçları, SQL, SSAS, SSIS ve SPSS Modeler.

3. Veri Mühendisi

Veri mühendisleri, veri bilimcileri tarafından analiz edilecek “büyük veri” altyapısını hazırlayan veri uzmanlarıdır. Çeşitli kaynaklardan veri tasarlayan, derleyen, birleştiren ve büyük veriyi yöneten yazılım mühendisleridir. Ardından verilerin kolay erişilebilir olduğu ve sistemin sorunsuz çalıştığından emin olduktan sonra hedeflerinin doğrultusunda şirketlerinin büyük veri ekosistemi performansını optimize etmesini sağlamak için çalışırlar.

Ayrıca, büyük veri kümelerinin üstüne bazı ETL'ler (Çıkar, Dönüştür ve Yükle) yapabilir ve veri bilimcileri tarafından raporlama veya analiz için kullanılabilecek büyük veri ambarları oluşturabilirler. Bunun ötesinde, veri mühendisleri tasarım ve yapıya daha fazla odaklandıkları için, genellikle büyük veri için herhangi bir makine öğrenmesi veya analitiği bilmeleri beklenmez.

Becerileri: Hadoop, MapReduce, Hive, Pig, Veri akışı, NoSQL, SQL, programlama.

Kullandıkları Araçlar: DashDB, MySQL, MongoDB, Cassandra

4. Veri Bilimcisi

Bir veri bilimcisi, 21. yüzyılın simyacısıdır: Ham verileri arıtılmış içgörülere dönüştürebilen biri. Veri bilimcileri kritik iş problemlerini çözmek için istatistik, makine öğrenmesi ve analitik yaklaşımlar uygularlar. Öncelikli işlevleri kuruluşların büyük veri hacimlerini değerli ve eyleme geçirilebilir içgörülere dönüştürmelerine yardımcı olmaktır.

Aslında veri bilimi kendi başına yeni bir alan değil, ancak makine öğrenimi ve bilgisayar bilimi tarafından yönlendirilen ve otomatik hale getirilen gelişmiş bir veri analizi düzeyi olarak düşünülebilir. Başka bir deyişle, veri bilimcilerin veri analitik becerilerine ek olarak, veri bilimcilerinin güçlü programlama becerilerine, yeni algoritmalar tasarlama becerisine, büyük veriyi ele alma ve alan bilgisinde bazı uzmanlıklara sahip olmaları beklenmektedir. Ayrıca, veri bilimcilerinden bulgularının sonuçlarını görselleştirme teknikleri kullanarak, veri bilimi uygulamaları oluşturarak ya da veri (işletme) sorunlarının çözümleriyle ilgili ilginç hikayeler anlatarak yorumlamaları ve sunmaları beklenir.

Bir veri bilimcisinin problem çözme becerileri, istatistiksel modeller oluşturmak veya verilerdeki kalıpları keşfetmek için geleneksel ve yeni veri analizi yöntemlerinin anlaşılmasını gerektirir. Örnek olarak bir öneri motoru oluşturmak, borsa tahmininde bulunmak, hastaları benzerliklerine göre teşhis etmek veya sahte işlem modellerini bulmak verilebilir.

Veri bilimcileri, belirli bir iş problemi göz önünde bulundurulmaksızın bazen büyük veriyle sunulabilir. Bu durumda, meraklı veri bilimcilerin verileri araştırması, doğru soruları bulması ve ilginç bulgular sağlaması bekleniyor! Bu çok zordur, çünkü verileri analiz etmek için güçlü bir veri bilimcisinin makine öğrenmesi, veri madenciliği, istatistik ve büyük veri altyapıları konularında farklı teknikler konusunda çok geniş bir bilgiye sahip olmaları gerekir.

Farklı boyut ve şekillerde farklı veri kümeleriyle çalışma deneyimine sahip olmalı ve algoritmalarını büyük boyutlu veriler üzerinde etkin ve verimli bir şekilde çalıştırabilmeli, bu da en son teknolojilerle güncel kalmayı gerektirir. Bu nedenle, dil bilimi ve veritabanı teknolojileriyle ilgili deneyim de dahil olmak üzere bilgisayar biliminin temellerini ve programlamasını bilmek önemlidir.

Becerileri: Python, R, Scala, Apache Spark, Hadoop, makine öğrenmesi, derin öğrenme ve istatistik.

Kullandıkları Araçlar: Veri Bilimi Deneyimi, Jüpyter ve RStudio.

En iyi yeteneklerin kariyer platformu toptalent.co'ya üye ol, Türkiye'nin ve dünyanın en iyi şirketlerinin iş, staj ve kariyer fırsatlarını keşfet.


İLGİNİ ÇEKEBİLECEK İŞ İLANLARI

POPÜLER MAKALELER

bimilim