Veri Analizi Mülakat Soruları
Veri bilimci mülakatı sırasında, işletmeler genellikle adayların veri analizi becerilerini değerlendirmek ve yeteneklerini keşfetmek için soru sormaktadır. Mülakatta, veri analizi mülakat soruları olarak sıklıkla sorulan bazı sorular vardır. Bu yazıda veri analizi mülakat soruları ve olası cevaplar verilmiştir.
1) Metin analitiği için Python veya R, hangisini tercih edersiniz?
Aşağıdaki nedenlerden dolayı Python’ı tercih ederiz:
- Python en iyi seçenek olacaktır çünkü kullanımı kolay veri yapıları ve yüksek performanslı veri analiz araçları sağlayan Pandas kitaplığına sahiptir.
- Python, tüm metin analitiği türleri için R ‘a göre daha hızlı performans gösterir.
2) Analizde, veri temizlemenin nasıl bir rolü vardır?
Veri temizleme, analizde yardımcı olur, çünkü:
- Birden fazla kaynaktan gelen verilerin temizlenmesi, veri analistlerinin veya veri bilimcilerin birlikte çalışabileceği bir biçime dönüştürülmesine yardımcı olur
- Veri temizleme, makine öğreniminde modelin doğruluğunu artırmaya yardımcı olur.
- Zahmetli bir süreçtir çünkü veri kaynağı sayısı arttıkça, bu kaynakların ürettiği veri hacmi nedeniyle verilerin temizlenmesi için geçirilen süre artmaktadır.
- Yalnızca verilerin temizlenmesi, zamanın %80’i kadar sürebilir ve bu da veri temizliğini analiz görevinin kritik bir parçası haline getirir.
3) Tek değişkenli, iki değişkenli ve çok değişkenli analiz türleri arasında ayrımı özetler misiniz?
Tek değişkenli analizler, belirli bir zaman noktasında yer alan değişkenlerin sayısına göre farklılaştırılabilen tanımlayıcı istatistiksel analiz teknikleridir. Örneğin, bölgeye dayalı satışların pasta grafikleri yalnızca bir değişken içerir ve analiz tek değişkenli analiz olarak adlandırılabilir.
İki değişkenli analiz, bir dağılım grafiğinde olduğu gibi bir seferde iki değişken arasındaki farkı anlamaya çalışır. İki değişkenli analiz, iki değişkenin eşzamanlı analizidir diyebiliriz. Örneğin, satış ve harcama hacminin analizi, iki değişkenli analizin bir örneği olarak kabul edilebilir.
Çok değişkenli analiz ise değişkenlerin yanıtlar üzerindeki etkisini anlamak için ikiden fazla değişkenin incelenmesiyle oluşturulan analizdir.
4) Yıldız şemasını açıklayınız.
Merkezi bir tabloya sahip geleneksel bir veritabanı şemasıdır. Bu şema, bir veritabanında bir çok tablonun birbirlerine bağlı olmadan, ancak birbirlerine referans veren bir şekilde düzenlenmesini sağlar. Yıldız şemasında, boyut (Dimension-dim) tabloları filtrelemeyi ve gruplandırmayı destekler. Olgu tabloları ise özetlemeyi destekler. Bu şema, veritabanının sorgulanmasını kolaylaştıran ve veriye hızlı erişim sağlayan bir tasarım şemasıdır.
5) Küme örneklemesi nedir?
Küme örneklemesi, geniş bir alana yayılmış hedef kitle üzerinde çalışmanın zorlaştığı ve basit tesadüfi örneklemenin uygulanamadığı durumlarda kullanılan bir tekniktir. Küme örneklemi, her örnekleme biriminin bir öğeler koleksiyonu veya kümesi olduğu bir olasılık örneğidir.
Örneğin, bir araştırmacı Türkiye’deki lise öğrencilerinin akademik performansını araştırmak istiyor. Türkiye’nin tüm nüfusunu farklı kümelere (şehirlere) bölebilir. Daha sonra araştırmacı, araştırmasına bağlı olarak basit veya sistematik rastgele örnekleme yoluyla bir dizi küme seçer.
Görüşmelerinizin Veri Analizi kısmında iş verenlerin sorduğu/sorabileceği bazı soruları inceledim. Sizin de görüşmelerinizde karşılaştığınız farklı sorular olursa yorum olarak paylaşabilirsiniz. Bol şans!