Türk yazılım şirketi VNGRS, Türkiye’nin yapay zeka alanındaki en önemli adımlarından birine imza attı. Şirket, sıfırdan Türkçe dilinde eğitilmiş ilk büyük dil modeli olan Kumru LLM’yi resmi olarak tanıttı. Tamamen yerli mühendislik altyapısıyla geliştirilen bu model, yapay zekanın Türkçe üzerindeki performansını küresel ölçekte ileri taşımayı hedefliyor.
Kumru, 7,4 milyar parametreye sahip güçlü bir yapay zeka modeli olarak dikkat çekiyor. Modelin mimarisi, modern LLM teknolojilerinin temelini oluşturan Mistral v0.3 altyapısı üzerine inşa edildi. VNGRS ekibi, modeli yalnızca Türkçe için optimize ederek dilin kendine özgü yapısını derinlemesine analiz edebilen bir sistem ortaya koydu. Bu sayede Kumru, metin üretimi, özetleme, belge analizi ve soru-cevap gibi görevlerde yüksek doğruluk oranı sunabiliyor.
Kumru’nun en dikkat çekici yönlerinden biri, 16 GB VRAM’e sahip standart ekran kartlarında bile çalışabilmesi. Bu, Türkiye’deki araştırmacıların ve geliştiricilerin pahalı donanımlara ihtiyaç duymadan büyük dil modelleriyle çalışabilmesini mümkün kılıyor. Yaklaşık 45 gün süren eğitim sürecinde, 500 GB’lık temizlenmiş ve yinelenmemiş veri seti kullanıldı. Bu devasa veri seti, modelin Türkçenin dil yapısını, deyimlerini ve bağlam ilişkilerini öğrenmesini sağladı.
Modelin bilgi kesim tarihi Mart 2024 olarak belirtiliyor. Yani Kumru, güncel Türkçe içerikleri anlayabilecek kadar yeni verilere dayanıyor. Bununla birlikte, VNGRS ekibi gelecekte modeli düzenli olarak güncellemeyi planlıyor. Kumru, 8.192 token uzunluğunda bağlam penceresi sayesinde uzun metinleri tek seferde işleyebiliyor; bu da yaklaşık 20 A4 sayfası büyüklüğünde bir içeriği analiz edebilmek anlamına geliyor.
VNGRS, ayrıca daha hafif bir sürüm olan Kumru-2B modelini de duyurdu. Bu sürüm 2 milyar parametreye sahip ve yalnızca 4,8 GB bellek ile çalışabiliyor. Kumru-2B’nin açık kaynak olarak Hugging Face üzerinde erişime açıldığı belirtiliyor. Böylece geliştiriciler, kendi uygulamalarına kolayca entegre edebilecekleri bir Türkçe LLM modeline ulaşabiliyor.
Kumru LLM’nin kullanım alanları oldukça geniş. Kurumsal veri analizi, müşteri destek otomasyonu, belge özetleme, eğitim içerikleri oluşturma ve Türkçe chatbot sistemleri gibi farklı alanlarda kullanılabiliyor. Ayrıca modelin kodlama ve İngilizce metinlerde de makul bir performans sunduğu ifade ediliyor.
Projenin tanıtımıyla birlikte kumru.ai adresinde demo sürümü de kullanıma sunuldu. Böylece kullanıcılar, doğrudan tarayıcı üzerinden modeli test edebiliyor. Kumru’nun bu alanda yalnızca bir başlangıç olduğu, gelecekte Türkçe odaklı daha büyük modellerin geliştirileceği vurgulanıyor.