Bu repository, SistersLab'in Toplum Gönüllüleri Vakfı TOG tarafından desteklenen "Women in Tech Academy" projesi için harzırlanmış olan bitirme projesini içerir. Bu veri seti içerisinde; filmler, filmlerin hangi ülkede geçtikleri, filmlerde oynayan aktörler, filmlerde hangi dillerin kullanıldığı, filmlerin türleri gibi bilgiler bulunmaktadır.
8 veri seti mevcuttur:
- actors.csv : Aktör ID'leri ,aktörlerin adları ve cinsiyetleri bilgilerini içerir.
- countries.csv: Filmlerin çekildiği ülkeler hakkında bilgi içerir.
- genres.csv: Film türleri hakkında bilgi içerir
- languages.csv: Filmlerin hangi dilde çekildiği bilgilerini içerir
- movies.csv : Film ID'leri,Tür ID'leri isimleri ve çekildikleri yıllar
- movies2actors.csv : Aktörler,oynadığı karakterler ve sahne sayıları hakkında bilgiler içerir.
- prodcompanies.csv: Filmlerin hangi yapım şirketleri tarafından çekildiği bilgisini içerir
- ratings.csv: Filmlerin aldığı puan, oy sayıları ve film dağıtımı hakkında bilgiler içerir.
- Pandas
- Matplotlib
- Seaborn
- Sütunlardaki veriler düzenlendi, biçimlendirildi, sayı ve noktalama işaretleri kaldırıldı.
- NaN değer içeren verilerin bazıları silindi.
- Yapılan analiz ve görselleştirmelerden bir kaç örnek aşağıda yer almaktadır. Detaylara kodların yer aldığı dosyadan erişebilirsiniz.
- Ülkelere göre çekilen film sayısı
- Türlere göre film sayısı
- Aktörlerin oynadığı film türleri
- Cinsiyete göre aktörler
- Yıllara göre kadın erkek aktor dağılımı
- En yüksek puan almış 10 film
- En fazla filme sahip şirketler
- Dillere göre film dağılımı
