top of page

GitHub Kodunuzu Yapay Zeka Eğitmek İçin Kullanıyor mu? 2025'te Her Geliştiricinin Bilmesi Gereken Copilot Gerçekleri

  • Yazarın fotoğrafı: Emre Erdin
    Emre Erdin
  • 18 Ağu
  • 3 dakikada okunur
Dikkat: Bu yazıyı okuduktan sonra muhtemelen GitHub ayarlarınızı değiştirmek isteyeceksiniz.

Eğer son iki yıldır kod yazıyorsanız, GitHub Copilot'la karşılaşmış olmanız neredeyse kaçınılmaz. Bu "AI destekli programcı asistanı", yazdığınız tek satırdan sonra tamamını tahmin edebiliyor, fonksiyonları sizin yerinize tamamlıyor, hatta bazen bütün bir class'ı göz açıp kapayıncaya kadar yazıyor.


Ama hiç merak ettiniz mi: Bu mucizevi güç nereden geliyor?

Cevap sizi şaşırtabilir - ve muhtemelen rahatsız edecek.


Copilot'un "Gizli" Veri Kaynağı: Sizin Kodlarınız

Aslında bu hiç de gizli değil. Microsoft, Copilot'u eğitmek için GitHub'daki milyarlarca satır herkese açık kodu kullandığını resmi olarak kabul ediyor. Yani şu demek oluyor: Geçmişte yazdığınız ve GitHub'da public olarak paylaştığınız her kod satırı, muhtemelen Copilot'un beynini besleyen devasa veri setinin bir parçası.


github-microsoft
Github Microsoft

Teknik Gerçek: Copilot Nasıl "Düşünüyor"?

Copilot'un arkasında OpenAI Codex adında, GPT-3'ten türetilmiş devasa bir dil modeli (LLM) bulunuyor. Bu sistemin çalışma mantığı şöyle:


  1. Veri Madenciliği Süreci:

    1. GitHub'daki tüm public repolar tarandı

    2. Python, JavaScript, Go, Rust - her dildeki kod analiz edildi

    3. Syntax kurallarından design pattern'lere kadar her şey öğrenildi


  2.  İstatistiksel Öğrenme:

    1. Model, milyonlarca kod örneğini analiz ederek kalıpları çıkardı

    2. Hangi kod parçasından sonra ne gelme ihtimalinin yüksek olduğunu hesapladı

    3. Sonuç: Yazdığınız koda bakarak bir sonraki adımı şaşırtıcı doğrulukla tahmin edebilen sistem


Sorun tam burada başlıyor.


Büyük Hukuki Savaş: "Fair Use" mu, Lisans İhlali mi?

Bu konu, yazılım dünyasını ikiye bölen dev bir tartışmaya dönüştü. İki taraf da haklı gerekçeler sunuyor:


Microsoft'un Savunması: "Bu Yasal Dönüşüm"

Microsoft ve OpenAI, işlemlerinin ABD telif hakkı yasalarındaki "Fair Use" (Adil Kullanım) doktrini kapsamında olduğunu savunuyor:


"Ham kodu alıp tamamen yeni bir hizmet yarattık. Bu dönüştürücü bir kullanım ve yasaldır."


Geliştiricilerin Karşı Argümanı: "Lisanslar Hiçe Sayılıyor"

Gerçek şu: Public kod demek, sahipsiz kod demek değil. GitHub'daki kodların neredeyse tamamı açık kaynak lisanslarıyla korunuyor:

  • MIT Lisansı: "Kodumu kullan, ama adımı belirt"

  • GNU GPL: "Kullan, ama senin projen de açık kaynak olmalı"

  • Apache License 2.0: Atıf ve patent hakları gereklilikleri


Problem: Copilot bu lisansların hiçbirine uymuyor. Önerdiği kodda ne orijinal yazar bilgisi var, ne de hangi lisans altında olduğu belirtiliyor.


2024-2025 Güncel Gelişmeler: Durum Nasıl Değişti?


2024 Sonuçları:

  • Matthew Butterick v. GitHub davasının DMCA iddialarının çoğu reddedildi

  • Ancak bazı temel iddialar hala devam ediyor


2025'in Bomba Kararı: Şubat 2025'te Thomson Reuters v. Ross Intelligence davasında federal mahkeme, AI eğitiminde telif hakkı kullanımının "fair use" olmadığına karar verdi. Bu, sektör için ilk büyük emsal karar oldu.


Resmi Kurumlar Devreye Girdi

ABD Telif Hakkı Ofisi, Mayıs 2025'te generative AI eğitimi konusunda kapsamlı rapor yayınladı. Artık bu konu sadece tech şirketleri arasında değil, resmi düzeyde tartışılıyor.


Kendinizi Nasıl Koruyabilirsiniz? Pratik Adımlar

Teoriyi bırakıp pratiğe dönelim. Bir geliştirici olarak neler yapabilirsiniz?


Risk 1: Gizli Kodlarınızın Sızma İhtimali

Gerçek tehlike: Copilot'u kullanırken yazdığınız kod parçaları ve aldığınız öneriler, hizmeti iyileştirmek için Microsoft'a gönderilebiliyor.


Kritik adım - Hemen yapın:

  1. GitHub hesabınıza girin

  2. Settings > Copilot menüsüne tıklayın

  3. "Allow GitHub to use my code snippets for product improvements" seçeneğinin işaretini kaldırın

Bu basit değişiklik, kodlarınızın telemetri verisi olarak gönderilmesini durduracak.


Risk 2: Lisans Kirliliği Tuzağı

Copilot'un önerdiği kod GPL lisanslıysa ve siz bunu kapalı kaynak projenize eklerseniz, tüm projenizin kaynak kodunu açmanız istenebilir.


Koruma stratejileri:

  1. Asla körü körüne kopyalamayın - Her öneriyi anlayın ve kendi mantığınızla yeniden yazın

  2. Filtreleri aktifleştirin - "Suggestions matching public code" seçeneğini "Block" yapın

  3. Şüphe duyduğunuzda araştırın - Spesifik kodları Google'da aratarak orijinal kaynaklarını bulun


Sonuç: Bilinçli Geliştirici Olmanın Zamanı

GitHub Copilot güçlü bir araç, ama bu gücü körü körüne kullanmak büyük riskler taşıyor. 2025'te artık "bilmiyordum" deme lüksümüz yok.


Bu yazı size faydalı olduysa, diğer geliştiricilerle paylaşmayı unutmayın. Birbirimizi bilgilendirmek, hepimizin yararına.

Yorumlar


© 2025 Emre Erdin Tüm Hakları Saklıdır

bottom of page