Sitemizde ve uygulamamızda, siteyi ve uygulamayı kullanımınızı analiz etmek, sosyal medya özellikleri sağlamak için çerezler kullanılmaktadır. Çerezler hakkında detaylı bilgi almak için Çerez Aydınlatma Metni’ni incelemenizi rica ederiz.

Sosyal Ağ (Graph) Analizi İle Covid 19 Virüsünün Hızlı Yayılımının Analizi

Oluşturulma Tarihi: 07.05.2020
Tüm dünyayı derinden etkileyen Covid 19 salgını, verilerin, veriyle konuşma ve analitiğin önemini bir kere daha ortaya koydu. Bazı ülkeler salgınla ilgili açıkladıkları verilerle araştırmacılara zengin kaynak sunuyor. Bu açık veriler hastalığı hem daha iyi anlamamıza hem de sahada çalışan sağlık çalışanlarına destek olabilecek yeni çıkarımlar ve öngörüler yapmamızı mümkün kılıyor.

b1.png

Pek çok ülkede Covid 19 salgını ve alınan önlemler devam ediyor. Salgınla ilgili internette yayımlanan veriler küçük, parçalı, belirli bir sistematikten yoksun. Bu nedenle genellemeler ve büyük çıkarımlar yapmak oldukça tehlikeli olsa da hastalığı anlamamıza destek olacak belli öngörüleri de içinde barındırıyor. Önümüzdeki 10 yıllar boyunca, salgın araştırmaları çok sayıda bilimsel disiplinin kritik gündemi olacak ve bu konuda binlerce bilimsel araştırma yapılarak, şu an farkında olmadığımız çok sayıda bulgu bilimsel yöntemlerle ortaya konulacak. Ancak yine de bu esnada veriyle uğraşan kişiler olarak, kamuya açılan verileri analiz ederek spesifik örneklerde ne olup bittiğini anlamak, önümüzü görebilmek için küçük de olsa ışıklar yakmak mümkün.

Veri ve Yaklaşım
Yukarıdaki perspektifle, Korea Centers for Disease Control & Prevention (KCDC) kurumu tarafından Kaggle’de paylaşılan (1) açık Covid 19 salgın verilerini sosyal ağ analizi metotlarıyla analiz ettik ve aşağıda özetlediğimiz sonuçları ortaya çıkardık.
Bu analizde ağırlıklı olarak Doç Dr. Mehmet Gençer tarafından yazılan “Sosyal Ağ Analizi: Ağ Kuramları ve Uygulamaları” kitabındaki yöntem ve yaklaşımlar kullanılmıştır.
 
Sosyal Ağ Analizi Nedir?
Sosyal ağ analizi, sosyal yapıları, yapı bileşenleri ve onların arasındaki ilişkilerin ağ analiz metotlarıyla analiz edilmesi olarak tanımlanabilir.

b2.png

Şekil 1 3 düğümlü (A-B-C) ve 2 çizgeli (AC, AB) basit bir ağ
 
Sosyal ağ analizinde, bileşenler birer düğüm (node), aralarındaki ilişkiler ise birer çizge (edge) olarak temsil edilir. Çizgeler tek ya da çift yönlü olduğu gibi farklı ağırlıklarda da olabilirler. Düğümler ve çizgelerin görselleştirilmesi yoluyla bir ağ edilir ve merkezilik, geçişkenlik, modularite gibi metriklerin hesaplanması yoluyla da ağın dinamikleri ortaya çıkartılır.

Kore Salgın Verileri üzerine Sosyal Ağ Yaklaşımı
Covid 19 salgınıyla ilgili en detay açık veri sağlayan ülkelerden bir Güney Kore oldu. Kore Hastalık Kontrol ve Önleme Merkezi (KCDC) tarafından Kaggle’da yayımlanan veriler sınırlı da olsa Covid hastalarının hastalığı kimden aldıklarını ve hastalığın hızla kişiden kişiye nasıl yayıldığına dair önemli bilgileri içeriyor.
Veri seti üzerinde yaptığımız ön analizlere göre veri seti içerisinde detaylı bilgileri yayımlanan 3389 hastanın 822’sine (%24) hastalığın kimden bulaştığı tespit edilmiş. Kişileri birer düğüm, virüs bulaştırma eylemini de bir çizge olarak ele alarak, bu veriyi açık kaynak kodlu sosyal ağ analiz aracı Gephi’de görselleştirdik ve analiz ettik.
Örneğin veri setinin küçük bir kesiti üzerinde şekil 2’deki gibi bunu görsel olarak ifade etmek istersek;
  • 1 No’lu kişi, virüsü 2-3-4 ve 5 No’lu kişilere bulaştırmış
  • 5 No’lu kişi 6 No’lu kişiye
  • 6 No’lu kişi de 7 No’lu kişiye bulaştırmış.
b3-(1).png
 
Şekil 2 Kore salgın sosyal ağ gösteriminden bir kesit
 
Bu mantıkla tüm Kore salgın sosyal ağ verisi force-directed ağ çizim algoritmaları kullanılarak şekil 3’deki gibi görselleştirilmiştir.
 
b4.png

Şekil 3 Kore Covid salgın sosyal ağı
 
  • Ağdaki her düğüm bir kişiyi
  • Bağlantısız her bir küme bir kişi etrafındaki enfekte hastaları
  • Düğümlerin büyüklükleri, kişilerin virüs bulaştırma sayılarına bakarak etkisini
  • Düğümlerin renkleri de ağdaki alt hub’ları temsil etmektedir.
 
Şimdi bu gösterimden çıkan bazı ilginç noktaları vurgulayalım:
 
  1. Kore verisinde en yoğun kümeye bakacak olursak sadece bir kişinin izolasyonu ile vakaların %6’sını engellemek mümkün olabilirdi;
b5.png

Şekil 4 En fazla bulaştıran kişinin hub'ı
 
En fazla yayılıma sahip kişinin (B kişisi) bulunduğu hub toplamda 67 hastadan oluşmaktadır.
Ağ detaylı incelendiğinde görülebileceği gibi,
A kişisi 6 kişiye virüs bulaştırmıştır. Bunlardan 4’ü hiç kimseye bulaştırmamış 1’i 1 kişiye virüs bulaştırmıştır. Ancak bulaştırdığı kişilerden biri olan B kişisi ne yazık ki hastalığın 51 kişiye yayılmasına neden olmuştur. Yani, A kişisinin izole edildiği bir durumda, sadece onun direkt virüs bulaştırdığı 6 kişi değil, aynı zamanda dolaylı olarak virüs bulaşmasına neden olunan 51 kişi ve hatta onların da yaydığı toplamda 67 kişiye virüsün bulaşması engellenebilecekti.
Elimizdeki veri kısıtlı da olsa, bir kişinin izolasyonunun sadece o kişinin bağlantıda olduğu yakınları için değil aynı zamanda çok daha geniş bir kümedeki insanlar için de önem taşıyacağını net bir şekilde gösteriyor.
 
  1. Hastaların%64’ü kimseye virüs bulaştırmadığı halde, ortalama bulaştırma sayısı 1’e yakındır (0.78)
İncelediğimiz veri Covid 19 virüsünün yayılma riskinin çok yüksek olduğuna dair salgın uzmanlarından gelen yorumları desteklemektedir.

Tablo 1 Kore örneğinde bulaştırma değerleri

b6.png

Tablo 1’de görülebileceği gibi Kore örneğindeki hastaların %64’ü kimseye virüs bulaştırmadığı halde, bir kişi ortalamada 0.78 kişiye bulaştırmıştır.
Hiç kimseye virüsü bulaştırmayanları çıkardığımızda, ortalama virüsün bulaştırıldığı kişi sayısı 2.22’ye yükselmektedir.
  1. Virüsün yayılımı açısından kaç kişiye bulaştırdığınız kadar, sosyal ağ içerisindeki yeriniz (merkeziliğiniz) de kritiktir.
Şekil 5’de benzer sayıda kişi sayısına sahip 2 tane alt segmenti görebilirsiniz. Yeşil kümede 37 kişi, turuncu kümede ise 41 kişi yer alıyor.
Virüsün yayılımı açısından sadece bulaştırılan kişi sayısına bakıldığında turuncu kümedeki A kişisinin son derece kritik olduğu gözükmektedir. Bu kişi virüsü tek başına 27 kişiye bulaştırmıştır. Ancak sosyal ağ gözüyle baktığımızda yeşil kümedeki B-C-D-E kişilerinin de salgının yayılmasına kilit rolde olduğunu görebiliriz. A kişisine kıyasla çok daha az sayıda kişiye virüs bulaştırmış olmalarına rağmen toplamda yayılım etkileri benzer bir sonuç yaratmıştır.
 
b7.png

Şekil 5 Bulaştırma sayısına ölçeklendirilmiş benzer kişi sayısına sahip 2 küme
 
Bu nedenle virüsün yayılımı açısından çok sayıda kişiye bulaştırma derecesi önemli olduğu kadar, kişilerin farklı gruplar arasındaki köprülük, merkezilik dereceleri de kritik önem taşımaktadır.
Sosyal ağ analizinde kişilerin merkeziliğini ölçmek için çok sayıda metrik geliştirilmiştir. Bunlardan bir tanesi olan eccentricity merkezilik değeri hesaplanıp düğümler bu değere göre ölçeklendirilirse, yeşil kümedeki B-C-D-E düğümlerinin salgının yayılımı açısından kritik rol taşıdıkları gözlemlenebilmektedir.
 
b8.png

Şekil 6 Eccentricity merkezilik değerine göre ölçeklendirilmiş kümeler

Sonuç:
Kesin tedavi bulununcaya kadar Covid 19 ve salgın gerçeğiyle yaşamayı öğrenmek zorundayız. Bu nedenle virüs yayılım dinamiklerini anlamak, alacağımız önlemlerin daha rasyonel ve toplum nezdinde daha ikna edici olması için kritik. Bunun için de sosyal ağ analizinin oldukça güçlü bir metodolojik yaklaşım sunduğunu düşünüyoruz.  
Son derece dar kapsamlı ve ufak bir örnek verinin bile, salgın dinamiklerini daha iyi anlamak için bize önemli fırsatlar sunduğunu gördük. Ülkelerin sağlık kurumları tarafından paylaşılan verilerin miktarı ve uzun vadeli saha çalışmaları arttıkça, daha genellenebilir çıkarımlar yapmak mümkün olacaktır.
Hastalığın teşhisi ne kadar önemliyse teşhis sonrası yapılacak çalışmalar da bir o kadar önemlidir. Sağlık Bakanlığı’nın açıklamalarında son zamanlarda adını çok duyduğumuz “Filyasyon” isimli özel saha ekipleri; tam da bu alanda çalışan, hastanın tüm temas noktalarını araştıran ve hasta yayılım hub’larını izole etmeye çalışan ekiplerdir.
Sosyal Ağ Analizi (SNA) yöntemiyle açık bir veri üzerinde yaptığımız bu çalışma hem bakanlık tarafından uygulanan Filyasyon’un önemini, hem de veriye dayalı analiz ve analitikle bu çalışmaların desteklenmesi gerektiğini göstermektedir.
 
Özgür Akarsu, KoçDigital

- Gençer,M. Sosyal Ağ Analizi: Ağ Kuramları ve Uygulamaları
- Eccentricity Merkezilik Değeri bir düğümden diğer tüm düğümlere en kısa yollar arasındaki en uzun değerin bulunmasıyla hesaplanır. Detaylar için; https://www.centiserver.org/centrality/Eccentricity_Centrality/
 
 
 

Nasıl Yardımcı Olabiliriz?

KoçDigital'in kurumlara değer yaratan çözümleri ile tanışın!


Lütfen doğrulama kodunu giriniz :
 Security code