Instagram Gerçek ve Sahte Kullanıcıların Analizi

Author:

Year-Number: 2024-1
Yayımlanma Tarihi: 2024-03-22 11:27:20.0
Language : Türkçe
Konu : Bilgisayar Mühendisliği
Number of pages: 29-44
Mendeley EndNote Alıntı Yap

Abstract

Bu makalede; Instagram’daki sahte hesapların ve bu hesaplar üzerinden dolandırıcılık sorunlarının son yıllarda fazlasıyla artması sebebiyle, kullanıcı hesaplarının gerçek veya sahte olma olasılıklarını sınıflandırmak amacıyla dört farklı veri madenciliği algoritmasının kullanımını detaylı bir şekilde ele almaktadır. Her bir algoritmanın temel prensipleri, avantajları ve uygulama süreçleri incelenerek, Instagram kullanıcı davranışlarını analiz etmek ve sahte hesapları tespit etmek için nasıl kullanılabilecekleri açıklanmıştır. Makalede, projenin ilk aşamasında 60.000’den fazla veri içeren zengin bir veri seti kullanılarak her bir algoritmanın bu veri seti üzerinde nasıl uygulandığı ve sonuçlarının nasıl değerlendirildiği detaylandırılmıştır. Özellikle, model performanslarını ölçmek için kullanılan AUC, Accuracy, Mean Per-Class Error, LogLoss ve Confusion Matrix gibi metrikler üzerinde durulmuştur. Makalenin sonucunda, dört modelin karşılaştırılması yapılarak, her modelin güçlü ve zayıf yönleri tartışılarak, Instagram hesaplarının sınıflandırılmasında hangi algoritmanın daha etkili olduğuna dair değerli bilgiler sunulmuştur. Bu bilgiler, kullanıcı deneyiminin iyileştirilmesi ve platform güvenliğinin artırılması gibi alanlarda kullanılabilir.

Keywords

Abstract

In this article, due to the increasing number of fake accounts on Instagram and the fraud problems associated with these accounts in recent years, it discusses in detail the use of four different data mining algorithms to classify the likelihood of user accounts on Instagram being real or fake. The basic principles, advantages, and application processes of each algorithm are examined, and how they can be used to analyze Instagram user behavior and detect fake accounts is explained. In the article, a rich dataset containing more than 60,000 data points was used in the first stage of the project. It details how each algorithm was applied to this dataset and how the results were evaluated. In particular, metrics such as AUC, Accuracy, Mean Per-Class Error, LogLoss, and Confusion Matrix, which are used to measure model performance, are emphasized. As a result of the article, valuable information is provided about which algorithm is more effective in classifying Instagram accounts by comparing four models and discussing the strengths and weaknesses of each model. This information can be used in areas such as improving user experience and increasing platform security.

 

 

Keywords