Mayıs - Ağustos tarihleri arasında tez yazıp sonra bu tezi sunup savunmamı anlattığım bu yazıya hoşgeldiniz. 

*

Doktora tezi nedir? Özetle 4-6 sene boyunca üzerinde çalışıp kanıtlamaya çalıştığınız şeyin raporudur. Önermeniz / teoreminiz / teziniz ne, bu tezi yazmaya sizi iten şey ne, veri ne, metodunuz ne, deneylerin sonuçları ne, bunlardan çıkardığımız sonuç ne, çalışma ve sonuçları neden önemli, bu çalışma ileride ne tip çalışmalara yön verebilir. Örneğin tezim "Türkiye gündeminin yarısı sahteymiş.", verim Twitter verisi, metodum makine öğrenmesi vs. Bunları ilk sene belirleyip planlamak gerekiyor. İlk senenin sonunda da planınızı doktora hazırlık sınavında anlatıyorsunuz. Bunu EPFL'de şu şekilde yapıyorsunuz: konunuz üzerinde çalışmış alakalı üç tane makale seçiyorsunuz bunları sunup sıkıntılarından bahsediyorsunuz sonra kendi yaklaşımınızı anlatıp jüriyi bunu yapabileceğinize inandırıyorsunuz. Doktora yeterlilik sınavındaki acı tecrübelerimi daha önce blogta yazmıştım.

Yalnız bir sıkıntı var, benim ve diğer bir çok doktora öğrencisinin durumunda olduğu gibi daha ilk seneden araştırmaya başlıyorsanız bütün bunları önceden planlayamıyorsunuz. Ben yeterlilik sınavında sallama bir tez planı sundum. Hocalar da çok üzerinde durmadılar, formaliteden bir şeyler salladığımı ve bunun illa değişeceğini zaten kendileri de biliyorlar. Bana söyledikleri şuydu "Doktoranın sonunda yaptığın çalışmalar bir hikaye oluşturabiliyor olmalı." Çalışmadan kastım da konferans makalesi veya yayınlanmamış makale taslağı. Bunlar da genelde üç tane oluyor. Onları birleştirip üzerine hikaye kurgulayıp teze çeviriyorsun. 

Dördüncü senenin sonuna yaklaştığımda bitirdiğim çalışmalar "Türkiye gündeminin yarısı sahteymiş." ve Twitter'da şekil değiştiren Gregor Samsa hesaplar. Bunlardan tam olarak ne hikayesi çıkarabilirdim ki? Ev kirasını ödemekte zorlanan Gregor Samsa birgün yataktan kalktığında kendini beyaz bir trolle dönüşmüş olarak bulur.. Bu mu yani? Hoca "Artık ufaktan tezini yazmaya başlayabilirsin." diyor ama o da bilmiyor bunlarla ne hikayesi yazacağım. 

Dört sene geçti, elimde sadece bir makale ve bir de kabul edilmeyen makalemsi metin var. Tez yazabilirmişim gibi durmuyor. 

Dördüncü senenin sonunda çok enteresan bir şey oldu ve olay bir anda "Ben asla bu tezi yazamayacağım"dan "Ufukta tez gözüktü, bir an önce yazsam da mezun olsam."a döndü. Bu şekilde doktorayı altı seneye kadar uzatacakken beşinci senenin sonunda mezun oluverdim. Ne oldu anlatayım.

Dördüncü senenin başında (ne dördüncü seneymiş arkadaş) bir mastır öğrencisine hobi projesi verdim. Proje şöyle gelişti, ikinci sene verdiğim dandik bir öğrenci projesini bi konferansa (daha doğrusu konferansın atölyesine) göndermiştim, kabul edildi. Koronadan dolayı zoomdan konferansa katılıp makaleyi sunduk. O konferansta başka bir sunum dinledim. Sonrasında Netflix'e de çıkıp meşhur olan ve sosyal medya üzerine çalışan bir hoca retweet botları tarafından pompalanmış tweetleri yakalamak için geliştirdiği metodunu sundu. Tweetleri de marketten retweet hizmeti satın alarak pompalanmış, yani yanlışlıkla harika bir retweet botu dataseti oluşturmuş. Dedim ben bu dataseti alır üzerine retweet botu bulma çalışması yaparım. Hocayla emailleştim ve aldım dataseti. EPFL'den bir mastır öğrencisine verdim analiz etsin diye.

Çocuk analiz edip bulgularını paylaştı, her hafta görüşüp üzerinde konuştuk. Her hafta sordum "Ya bu botlar özbeöz bot mu yoksa biri bu hesapları ele geçirip bot mu yapmış." diye. Çünkü Türkiye gündemini manipüle eden botlar ele geçirilmiş hesaplardı. Acaba aynı şey burada da olabilir miydi? Çocuk net cevap vermiyordu bir türlü. Hesaplara bak bana bir şey söyle diyordum. En sonunda cevapladı "Yok çalıntı hesap değil." bunlar diye. Dedim peki. Sonra retweet botu tespiti metodu geliştirdi, eh işte sonuçlar aldı, notunu aldı ve dönem bitti.

Aradan altı ay geçti, yazın boş vaktim vardı (hep boş vaktim var zaten) dedim şu projeyi kodlayıp paperını yazıp aradan çıkarayım. İyi bir konferansa gönderdim nasolsa red gelir, ben de gelen hakem değerlendirmelerini kullanıp ikinci seviye bir konferansa gönderirim sonra. İki tatil arasında bir ay uğraştım, zaten çocuk daha önce projeyi yaptığı için projede neyin çalıştığını neyin çalışmadığını biliyordum. 

Ama proje beklediğimden farklı gelişti. Retweet botlarını bulmak çok kolaydı. Retweet botlarının tweetlerinin tamamı retweetti zaten. Retweet / tüm tweetler oranı %80'se retweet botu diyip %80 doğruluk yakalayabiliyordunuz. Dolayısıyla retweet botu tespiti makalesi yazmak çok saçmaydı. Ben de retweet botlarının davranışlarını analiz edip önceki makalelerdeki varsayımlarla karşılaştıran bir makale yazdım. En önemlisi de şuydu: bu hesaplar çalıntıydı. Mastırcı çocuk kafadan sallamış yani. Hesaplar kendi diyor "Hesabım çalındı bir sürü retweet var." falan diye bas bas bağırıyorlar. Retweet botlarının aslında çalıntı hesap olması önemli bir bilgi. Bir çok makalede araştırmacılar "Botlar çok gelişti insana benzeyen bot yazıyorlar." diyorlar. Botlar aslında insan oldukları olduğu için olabilir mi acaba? Tam da bunu yazan bir makale yazdım, eylülde çok iyi bir konferansa gönderdim. Bu konferansın bu makaleyi kabul edeceğini düşünmüyordum, hakem yorumlarını alır azıcık daha geliştir daha dandik bir konferansa yollarım diyordum. 

Beklemediğim bir şey oldu. Makale kabul aldı ya la. İki tane makalem olmuş oldu. Ama daha önemlisi şu, çalıntı hesapların sosyal medya manipülasyonu için kullanıldığını anlatan iki tane makalem oldu. Bir doktora tezi için üç makale gerekiyor demiştik. Benim üçüncü bir makalem var ama diğer ikisiyle alakası yok. Twitter'da isim değiştirip başka bir görev için kullanılan hesapların tespiti. Yani komedi sayfası politika sayfasına çevriliyor ben onu tespit ediyorum. Botlarla alakalı değil. 

Sonra ampul yandı. Bu isim değiştiren hesapların bazıları çalınıp satılan hesaplardı. Adam gidiyor Brezilyalı mankenin 300k takipçili hesabını çalıyor gidiyor onu Mustafa Sarıgül'e satıyor o da Türkiye Değişim Partisi resmi hesabına çeviriyor. İsim ve görev değiştiren hesapları bulurken bir yandan da çalıntı hesapları bulmuş oluyorum. 

Ufak bir hikaye değişikliğiyle elimde çalıntı hesaplarla alakalı üç tane makale olmuş oldu. O zaman dans!

*

Beşinci senede genelde gereksiz işlerle uğraştım. Teze hiç koymadığım iki projeye çalıştım, onları da basmadım da. Postdoc başvurularıyla uğraştım, bu başvurular için proje taslakları yazdım. Proje taslaklarına da giriş yazdım "Dezenformasyon çağımızın problemi rus troller şu bu." falan diye. Mart bitti, postdoc başvuruları bitti. Matrixe geri dönüp araştırma yapma zamanı geldi. Tezime koyacağım iki makale, yani "Türkiye gündeminin yarısı sahteymiş." makalesi ve retweet botları makalesi zaten basıldığı için onları direkt teze kopyala yapıştır yapabilirim. Ama şekil değiştiren hesaplar makalesi hala basılmadı ve makale de metodolojik olarak biraz zayıf. Tırt yani. Öylece teze koyarsam saldıracaklar. O yüzden 1.5 ay boyunca tüm odağımı o makaleye verdim, elimden geldiğince düzelttim, 15 Mayıs'ta tekrar gönderdim. 

Tez savunması gününü 23 Ağustos olarak ayarlamıştım, 35 gün öncesinden yani 17 Temmuz'da tezi teslim etmem gerekiyordu. 5 Haziran'da Cenova'da konferansa gidecektim. Türk botları makalesi metodolojik olarak biraz zayıf olduğundan ve tezi daha kuğul hale getirmem gerektiğini düşündüğümden konferansa kadar ki 20 günü de teze koyabileceğim sıfırdan bir makale yazmakla geçirdim. Makale ucu ucuna yetişmedi, sonra dedim ki boşver ben bunu daha geliştir daha iyi bir konferansa yollarım. Ama bulguları teze koydum yine de. 

Konferanstan döndüm. 11 Haziran. 1.25 ay kaldı ama ben bir tane daha konferansa gideceğim 25 Haziranda Barselona'da. Yani bir ayım kalmış. Daha hiçbir şey hazır değil. Ama nasıl olsa makaleler hazır, tek yapacağım o makaleleri birleştirmek. Ve bu arada ben "1 Temmuz'da döneceğim, 17 Temmuz'a kadar gece gündüz uğraşır yazarım." diyorum. İkinci konferansa gitmeden önce bir arkadaşla konuşup planımı anlattım "Sen şimdi dünyanın en iyi dokuzuncu üniversitesine iki haftada yazdığın tezi mi teslim edeceksin?" dedi. Silkindim ve kendime geldim. Acilen tez yazmam gerekiyordu.

*

Tezi şu şekilde kurguladım:

Benim savunduğum tez şu "Önceki araştırmalar kötü niyetli kişilerin sosyal medya manipülasyonu için sıfırdan hesap açıp onları kullandığını varsayıyor. Ben ise bu kişilerin sosyal medya manipülasyonunu çalıntı hesaplarla yaptıklarını ortaya koyuyorum." 

Üç tane ana bölümüm var: 

1. Çalıntı hesaplarla yapılan sosyal medya manipülasyonunun analizi: Trendleri manipüle eden Türk botlarını kullanarak yaptığımız bir vaka çalışması. 

2. Manipülasyonlarda kullanılan hesapların çalıntı olmasının akademik araştırmalara etkisi. Retweet botları üzerinden yaptığım bir vaka analizi ve önceki araştırmaları gömmem. 

3. Çalıntı hesapların tespiti. Ama nasıl çalıntı hesaplar? Çalıntı hesapları bulan çalışmalar var ama bu çalışmaların varsayımı şu: hackerlar hesabı çalıyor sonra hesabı aynen spam yapmak için kullanıyor. Biz ise varsayımı değiştiriyoruz, hackerın hesabın ismini değiştirdiği ve spam paylaşmadığı, hesabı normal kullandığı senaryoda çalıntı hesabı buluyoruz. Hesabın spam yapacağı varsayımında bulunan çalışmalar bu tip hesapları tespit edemiyor. Biz edebiliyoruz. 

Giriş ve Arkaplan bölümü yazdım. Buraların büyük kısmını postdoc başvurularımdan apardım, ne güzel kullanılmamış metin işte eheh. Arkaplanda güzel bir sosyal medya manipülasyonu tanımı ve sınıflandırması yaptım, ki böyle bir şey henüz literatürde yok. Sosyal medya manipülasyonunu sanki siber saldırı gibi modelleyerek yazdım, kendimi hekır gibi hissettim çok güzel oldu. Sosyal medya manipülasyonu "sosyal medya platformlarının zaafiyetlerini suistimal eden teknikler kullanarak kamuoyundaki diyaloğu bozmak." Türkçe'ye çevirince bütün karizması gitti. Neyse. Örneğin birden fazla Youtube hesabıyla dislike butonuna abanıp reisi trollemek. Bu saldırılardaki amaçlar şunlar olabilir, teknikler şunlar olabilir, zaaflar bunlar olabilir. Örneğin Twitter'da botlarla trend manipülasyonu yapmanın amacı istediğin kampanyayı tüm Twitter halkına anasayfadan duyurmak. Teknik, birbiriyle koordine şekilde çalışan botların kullanımı, zaaf, trend algoritmasının bot hesapları hesaba katmaması (veya katması) ve silinmeleri hesaba katmaması. 

Sonraki üç bölüme de makaleleri kopyala yapıştır yaptım. Makalelerini de aynı modele uyacak şekilde değiştirdim, böylece sanki yazılacakları önceden planlanmış gibiydi. Yani hepsi giriş, literatür taraması, metodoloji, analiz, çözümler, genele uyarlama, kısıtlar, etik analiz bölümlerini içeriyordu. Sonuna da bu tezin neden önemli olduğu ve ileride ne yapılabileceğini yazdım. Bir de diğer tezlerde olmayan bir bölüm koydum "Öneriler" diye, orada da "Araştırmacılar bot yakalamak yerine botların etkilerini araştırmalı, platformlar daha saydam olmalı, en önemlisi de araştırmacılar tüm ülkelere eşit önem vermeli, bakın Myanmar'da Facebook eliyle soykırım yapıldı." diye kamu spotu yaptım. 

*

Tezi temmuzda ağlayarak yazdım yetişmeyecek diye. Ama tam tersi 2 hafta falan sürdü, son birkaç gün ağırdan ala ala hataları düzelttim. Demek ki dünyanın en iyi 9. üniversitesine iki haftalık tez gönderilebiliyormuş ;D 

Tezi gönderdikten üç gün sonra interraile çıktım. Almanya, Danimarka, İsveç, Norveç gezip Fransa üzerinden İsviçre'ye geri döndüm. Hain planım interrail sırasında trenlerde sunumu hazırlayıp sonra Danimarka ve İsveç'te tanıdığım hocaların labına sunmaktı. Ama tabii ki bu plan tutmadı çünkü sunumu bitiremedim ve geziyi sallayıp lab gezesim gelmedi. Tembelliğim tuttu yani. Bir de İsveç ve Norveç'te geçirdiğim her gün daha çok batıyorum, çok pahalı zıkkım. Bari bir daha geri dönmeyecek şekilde gezeyim dedim. Hatta geziyi de sıkıldığım gerekçesiyle bir gün erken bitirdim, 22 gün gezip geldim.

Tez savunmasına çalışmak için sadece 9 günüm var. Slaytları hazırlayıp konuşacaklarımı ezberleyip sunum günü papağan gibi tekrarlayacağım. Daha önemlisi: 2 gün sonra labta provasını yapacağım. İyi hazırlanmazsam rezil olacağım. Eteklerim tutuşmaya başladı. Kendime sövdüm hayatımın sunumundan önce niye bu kadar uzun gezdim ben diye. Hep yüzüp yüzüp kıyıda boğuluyorum. 

Normal şartlar altında iki gün sıfırdan 40 dakikalık sunum hazırlayıp ezberleyip insanlara sunmak imkânsız ama bu şartlar altında imkânlı çünkü sunduğum şeyler beş senede yaptıklarımın tekrarı. Bir çoğunu postdoc başvuları sırasında sundum zaten. Laba sunmak kolay olunca kendime güvenim geldi. Birkaç geri bildirim verdiler. Hoca beğendi gibi gözüküyordu. 

Geri kalan günlerde çalışmalarda kullandığım teknik şeylere çalıştım. Teknik soru sorarlarsa zaten kendi kullandığım metotlardan sorarlar. Bir de sorabilecekleri soruları düşünüp yazıp verebileceğim cevapları not ettim. 

*

Tezi savunmak için kendinize jüri seçmek gerekiyor. 2 EPFL'den 2 tane de dış dünyadan jüri seçmelisiniz. Yabancı kontenjanından hoca seçmek kolay çünkü seçenek bol, mesele EPFL'de sizin konuya benzer konu çalışıp sizin konunuzla ilgilenecek biri. Yazdım sağa sola, redler geldi, hocadan öneri alıp bir daha yazdım. En sonunda jürimi tamamladım ve gelecek sezon için düz koşulara başladık.

EPFL'deki jüri üyelerinden biri benim gibi veri bilimi çalışan, hatta okulda araştırması bana en çok benzeyen hocaydı. Aynı zamanda doktora yeterlilik sınavımın başkanıydı ve beni ilk sınavda bırakmıştı. Hatta ikinci sınavda bile bırakacaktı :P Hem onun geri bildirimi işe yarar hem de nostaljik olur diye adama jürilik teklifi gönderdim, adam da yazdı "Jüri derken, uzman mı yoksa başkan mı? Başkan daha iyi olur benim için." Başkan ne bilmiyordum, herhalde önceki sınavdaki gibi konuşmayı yapan kişidir dedim. "Tamam başkan siz olun." dedim. 

Meğer başkanın görevleri farklıymış, tezi okuması, geri-bildirim vermesi gerekmiyormuş. Tek görevi sunum sonrası tartışmayı yönetmekmiş. Veeee... sıkı durun.... eğer jüri üyeleri geçme kalma konusunda oy birliğine varamazsa son kararı sınav başkanı veriyormuş. Yani adam istese beni sınıfta bırakabiliyormuş. Labtan arkadaşım dedi "O hocayı niye başkan yaptın, çok riskli bir hareket değil mi yeterlilik sınavında sana zorluk çıkarmıştı?". Harbiden ne yaptım ya? Kendi kendime bölüm sonu canavarı yarattım. Vay başıma gelenler.

Bir hafta boyunca bunu düşündüm. Sınavdan kalacağım, postdoc yatacak. Lozan'da tutsak kalacağım. Sınava da çalışasım gelmiyor çünkü çok sıkıcı. İnsan 5 sene boyunca uğraşıp yazdığı makalelere nasıl çalışabilir ki? Çalışıyorum ayağına başka işlerle uğraşıyorum boş yapıyorum. 

Bu arada doktora yeterlilik sınavı yazılarımı dört sene sonra baştan okudum ve okurken oha dedim. Slaytları son gün hazırlayıp öğleden sonra ikide olacak sınava uykusuz gitmek mi? Ben nasıl bir cevhermişim yahu. 

*

Sunum günü geldi. O kadar çok tekrar yapmıştım ki artık tek istediğim ezberlediklerimi sistemden atmaktı. Sunum yapacağım yere 40 dakika erken gittim teknik şeylerle uğraşacağım diye. Öyle oldu. Televizyonu açamadım bir türlü. Arkadaşıma yazdım beni kurtarması için dua ettim. Işık hızıyla geldi. Kürsüdeki tableti açtı ve onu açınca televizyon da açıldı (facepalm). Ama videokonferansı ve mikrofonu açamadı. Dolayısıyla uzaktan bağlanacak olan jüri üyesi için laptopumdan zoom açmam gerekti. O zooma da telefonumdan bağlandım. 

EPFL'den olan diğer hoca doğal dil işleme çalışan yeni bir hocaydı. Kendisini tanımıyordum, danışman hocam önermişti. Biraz sert olduğunu söyleyenler olmuştu da korkmuştum. EPFL dışından gelen hocaların biri UNIL'den, şu an kolaborasyon yaptığım, bana postdoc vaadeden hocaydı. EPFL mezunu genç ve gelecek vaadeden biri. Öbürü de Hollanda'da çalışan troller üzerine araştırmalar yapmış Güney Kıbrıslı yine genç bir hocaydı. İyi birine benziyordu. Zoom'dan katıldı gerçi neye benzediğini göremedik.

Hocalar sıra sıra geldi, el sıkıştık. Bir tanesi geç kaldı onu bekledik. Beklerken hocalar aralarında gırgır yaptı. Doktora yeterlilik sınavında da bu olmuştu. Böyle gırgır yapmaları çok hoşuma gidiyor, ortamdaki gerginliği azaltıyor. Daha doğrusu, ortamın gergin olmadığını hissettiriyor. Gerginlik de neymiş? 

Başkan hoca: "Lanet olsun ya. Tezi baştan sona okuyup geribildirim verdim sonra fark ettim ki ben başkanım, tezi okumama gerek yok. Azimliye başkanlığı bana verir misin demiştim bu tip uzun işlerden sıyrılmak için, yanlışlıkla hepsini yaptım." sfsdfsdf hahahaha. Diğer hocalar da güldüler. "Kendi geri bildirimini sınav başkanı böyle düşünüyor diye yazarsın artık ehehehe." dediler.

Geç kalan hoca üç dakika sonra falan geldi. Başkan merhaba arkadaşlar tez savunmasına hoşgeldiniz vs. diye açılışı yapıp sözü bana bıraktı.

Sunmaya başladım. Felaket sıkıcı bir şekilde sunuyorum çünkü ezberlediklerimi tekrarlıyorum bir şey yapmıyorum. Yalnız bir sorun var. Bir şey söylüyorum sonra söylediğimin aynısını cebimden duyuyorum. Zoom'a telefondan bağlanınca sesi tamamen kapatamıyorsun nedense. Ben kendimi cepten duyuyorum ama hocalar muhtemelen ekoyu duymuyor. Sunumu böyle devam ettirmekle telefonu hemen kapatmak arasında kaldım en sonunda hocalardan özür dileyip telefonu cebimden çıkarıp zoomdan çıktım. Bir yandan da "You had one job." diye kendime kızdım. 

Sunum fena gitmiyordu, dinliyor gibilerdi. Sadece başkan olan hoca dinlemiyordu, bilgisayarda bir şeyler yazıyordu, iş falan yapıyordu. Sunum bitti ve sorulara geçtik. 

Önce zoomdan bağlanan hoca sordu.

+Bu sahte Twitter trendleri bir Türk konsepti değil mi? Başka ülkelerde yok"

-Evet ama teorik olarak olabilir. Zaten bu makalede Türkiye'yi vaka çalışması olarak aldım ama bahsettiğimiz trend manipülasyonu saldırısı başka platformlarda bile yapılabilir. 

+ Neden başka ülkelerde yok peki

- Cevabı gerçekten bilmiyorum. Tahmin yürütürsem, belki Twitter diğer ülkelerde daha iyi bir filtreleme yapıyordur, Türkiye'de yapamıyordur, belki diğer ülkelerde trend manipülasyonuna ihtiyaçları yoktur, belki diğer ülkelerde başka teknikler kullanıyorlardır buna gerek yoktur. Bu saldırının son zamanlarda Katar'da yapıldığını duyduk ama sonra pek araştırmadık.

+ Bu çalışmada bir de sahte hesabı botçulara verip trend manipülasyonu yaptırmışsınız, bu etik mi?

- Değil ama muhtemel etkiyi azaltmak için sadece tek bir hesap kullandık bu hesap da yeni hesaptı, Twitter'ın bu hesabı filtreleyeceğini düşündük, hesabı da 6 ay sonra sistemden silip manipülasyonu engelledik.

+ İsim değiştiren hesaplar çalışmanızda neden hesapların bir çoğu Çin kaynaklı.

- Çinliler hesapları çalıp çalıp isimlerini değiştirip troll haline getirmiş çünkü :)

+ Botları çalışan araştırmacıların tespit ettikleri bot hesaplara bakıp bu hesapların neye benzediklerini araştırmalarını söylemişsin. Burayı biraz açar mısın ne kastediyorsun?

- (Bu başlı başına bi araştırma konusu olduğundan net bir cevabım yoktu, o yüzden salladım.) Bir çok araştırmacı verisetindeki botları tespit ettikten sonra bu botların neden bot olduğu üzerine analiz yapmıyor. Ben olsam tespit edilen botların hangi konuda botluk yaptığına bakarım, kimlerin reklamını yapıyor, diğer botlarla koordine mi ilerliyor ona bakarım.

Diğer hocaya geçtik. Birkaç tane çalışmamla alakalı detay sordu cevapladım. Sonra enteresan bir soru sordu.

+ Bu gündem manipülasyonlarını yapanlar farklı partileri destekliyorlar dedin. Öyleyse bu manipülasyonları neden yapıyorlar?

Partilerin neden gündem satın aldığı üzerine uzun bir seminer verdim. Hoca "Yok yok, ben partileri değil, gündem botlarını kontrol eden kişileri kastettim." dedi. Sonra danışman hocam döndü "Para için falan herhalde." dedi. Yani kopya verdi. Ben de "Evet para için." dedim. En basit soruda epik feyil oldum. 

Son hocaya geçtik, doğal dil işlemeci hoca. En çok bu hocadan korkuyordum çünkü sürpriz yumurtaydı. Ve tezimde doğal dil işleme kullanmıştım, onlardan sorup beni felaket zorlayabilirdi. Neyse ki yapmadı. Onun yerine çok güzel açık uçlu akıl dolu sorular sordu:

+ Retweet botları üzerine olan bölümde makine öğrenmesiyle bot bulan araştırmaları gömdün, makine öğrenmesi optimal yöntem değil dedin, ama sonraki bölümde makine öğrenmesi kullanıyorsun. Kendinle çelişmedin mi?

- Ben makine öğrenmesini %100 güvenebileceğimiz bir tespit sistemi olarak değil de şüpheli hesapları sonradan insanlar tarafından incelenmek üzere bulan bir sistem için kullanıyorum. (Yani makine öğrenmesine güvenemeyiz ama güvenmemiz de gerekmiyor diyorum).

+ Çalıntı hesap tespiti metodolojisini nasıl buldun ve daha farklı yapabilir miydin?

- Standard makine öğrenmesi prosedürünü kullandım, veri bul sonra elle sınıflandır. Ama şimdiki aklım olsa sınıflandırma işi için otomatik bir prosedür kullanırdım. (Meraklısına detay: İsmi ahmetten mehmete dönen kişinin önceki ve sonraki profiline bakıp değişmiş değişmemiş diye elle yazıyorduk, sonra tespit sistemiyle bunu otomatik yapmaya çalışıyorduk. Şimdiki aklım olsa ahmetten mehmete dönen profil bulmakla uğraşmazdım, direkt ahmet ve mehmet diye iki farklı profil bulur bunları birleştirirdim, böylece elle sınıflandırma yapmama gerek kalmazdı. Bir bakıma "pretraining" yapardım.)  

+ Retweet botları bölümünde önceki çalışmalara gömüyorsun. Sence bu önceki çalışmalar neden yanıldılar ve başka çalışmalar gelip seni haksız çıkartabilir mi?

- (Güzel soru) Varsayımları tutmuyorlardı, teoride mantıklı olan varsayımları pratikte işlemiyordu. Bence bu yüzden yanıldılar. Tabii ben de yanılabilirim, başkası gelip benim yanıldığımı gösterim benim çalışmamın üzerine koyabilir bilim böyle ilerler. Bu nasıl olur, örneğin biz retweet botu bölümünde üç farklı bot marketi kullandık, başka biri başka marketler kullanıp farklı retweet botu davranışları bulup bizi haksız çıkarabilir. 

+ Bu trend manipülasyonunda botlar tweet atıp siliyor dedin bunu Twitter çok rahat engelleyemez mi? Platformlar için tehlikesi ne bunun?

- Önlemek platformlar için ekstra efor ve ayrıca silinen tweetleri analiz etmek zorunda olacakları için etik sorunlar doğuruyor. Ama en önemlisi bunun platformlardan çok araştırmacılara tehlikesi var, manipülasyon verisi silindiği için manipülasyonu bulamıyoruz. 

Rus trollerin Amerika'da sokak protestosu organize ettiği bir Facebook etkinliği vardı, ciddi ciddi Amerika'dan katılımcılar gelmişti ama organizatörler yok piyasada :)) Bunu tweet atıp silip kaçan botlara benzettim, hikayemi destekledi iyi oldu. 

Son olarak hocama söz verdiler o da ondan bekleyeceğim çok klasik bir soru sordu: "Twitter %5 bot var diyor Elon musk %15, sence yüzde kaç var?"

Bu sorunun geleceğini tahmin ettiğimden cevap hazırlamıştım. Bu soruya cevabımın olmadığını, cevabı bulmak için bana gerekenleri ve bu gerekenler sağlanması durumunda izleyeceğim metodolojiyi anlattım. Biraz bu muhabbetin neden yersiz olduğunu anlattım. 

Hoca uzun zamandır görmediğim kızgın sırıtmasını yaparak: "Yüzde kaç olduğunu söylemeyen çok uzun bir cevap oldu bu.... Her ne kadar cevaba katılsam da."

Bir şeyler bir şeyler daha dedim. "Hala yüzde yok." dedi. Ben de en sonunda "Bir bilim insanının vereceği cevabı verdim. Adım Hıdır." dedim ve sustum.

*

Başkan tamam dedi ve beni dışarı çıkardı. Buna şaşırdım çünkü EPFL'nin sitesinde soruların iki bölüm halinde olacağını, daha tartışmaya devam edeceğimizi yazıyordu. Sıkıldılar herhalde. Dışarı çıktım, fakülteyi dolandım, doktoraya benle aynı anda başlayıp yeni bitiren bir arkadaşımı buldum sınava girdin mi dedi, tam şimdi girdim sonucu bekliyorum dedim. Aa hayırlı olsun dedi gitti. Biraz daha bekledim. Bekledikçe endişelenmeye başladım bu kadar uzun konuşuyorlarsa belki beni bırakmayı düşünüyorlardır? Bu arada capoeira yapmaya, havaya tekme atmaya falan başladım. Bayağıdır yapmıyordum özlemişim. 

Sonunda başkan çağırdı, odaya geri girdim.

Bir sessizlik.

Kürsüye geçtim. Bana bakıyorlar.

Açıklasanıza la?

Biraz daha sessizlikten sonra başkan yerinden kalktı geldi elimi sıktı ve "Tebrikler Dr. Yazar" dedi. Hoca araya girdi "Dur daha resmi olarak doktor değil." Başkan "Biliyorum ama asıl ismini söylemekten yırtmak istedim." Hala gırgır yapıyorlar ya. 

Sonra başkan geribildirim vermeye başladı.

"Jüri sunumu beğendi, tezdeki arkaplan kısmını beğendi. Tezde her bölümde genele uyarlama, kısıtlar, etik gibi bölümlerin istikrarlı bir biçimde tekrarlanmasını beğendi."

"Küçük bir öneri; çalışma sadece Türkiye'ye odaklanmasa daha çok beğenirlerdi. Ayrıca şekil değiştiren hesaplar başka türlü de bulunabilirdi ama artık gelecek sefere."

"Slaytlar iyiydi ama bazıları çok yoğundu."

"Çoğu sorumuzu cevapladın fakat bazen sorduğumuzdan başka soruya cevap veriyor gibiydin." (Şu para için trend satanlar sorusundan bahsediyor.) "Bir dahakine, soruyu önce anlayıp daha öz cevaplar verirsen seviniriz."

Bende de bi hastalık oldu sorulara aklıma ilk gelenleri bir şekle sokmadan beyin fırtınası yaparak cevaplamak. Üzerinde çalışmam gereken bir konu kesinlikle. Tabii buna nasıl çalışılır onu da bilmiyorum.

"Tezini geliştirmek için bir takım tavsiyelerde bulunacağız ama bunlar bir ayda yapılacak şeyler, o yüzden endişelenmene gerek yok." Tamam dedim. (Sonradan gönderdiler önerileri, hemen halledilebilecek şeklinde olan yazım yanlışı tipi şeyleri hallettim. Uzun sürecek gibi olan önerileri sallamadım. Onlar da benim sallamamamı sallamadılar.) 

Hocam da konuştu "Bu işten çok memnunum. Üzerinde çok düşündün, sonuçlar güzel." Başka sordu şimdi ne yapacaksın. "Indiana'ya gideceğim postdoca." dedim. Hocam dedi "Bu da ilginç bir hikaye, onların makalelerini eleştiriyordu şimdi oraya gidiyor." Doğal dilci hoca espiri yaptı "Bizi eleştirirsin demek, o zaman neden gelip kendin halletmiyorsun?" :D :D :D 

Herkesle tek tek el sıkışıp vedalaştım. EPFL yazısının önünde bir fotoğraf çekindim, doktor olduğumu (resmi olarak olmasa da) Instagramdan herkese duyurdum, laykları aldım. 

Haftasonu arkadaşlarımla göl kenarında piknik yaparak hem defansı hem de doğumgünümü kutladık. Eğlenceli oldu. 

Defanstan bir hafta sonra mastır öğrencimin tez savunmasını dinledim. Kafa rahat tez savunmasına girmek hoş oldu. Ondan sonraki gün de interraile çıktım, bir ay eve dönmedim sfasfsf

*

Bundan sonraki yazılardan haberdar olmak için şuradaki formu doldurabilirsiniz:

Veya sosyal medya: