Türkiye'nin Yerli Yapay Zeka Projesi: "Kumru" Aramıza Katıldı!

Kumru LLM: Türkçe Doğal Dil İşlemede Yeni Bir Dönem
Türkçe doğal dil işleme alanında çığır açacak olan Kumru LLM, tamamen Türkçe verilerle eğitilen ilk büyük dil modeli olarak tanıtıldı.
VNGRS tarafından geliştirilen bu model, 7,4 milyar parametreye sahip yapısıyla Türkçe merkezli yapay zekâ projelerinde yerelleştirilmiş, etkili ve özelleştirilebilir bir çözüm sunuyor. Kumru’nun yalnızca Türkçe için özel olarak eğitilen tokenizer yapısının, çok dilli modellere oranla %90’a kadar daha verimli çalıştığı belirtiliyor.
Kapsamlı bir eğitim setine sahip olan model, 300 milyar token ve 500 GB veri ile güçlendirilmiştir. Böylece Kumru’nun, Türkçenin sözcük yapısının yanı sıra dilin doğal akışını da anlama kapasitesine sahip olduğu ifade ediliyor.
Araştırmalardan kurumsal uygulamalara dek çeşitli alanlarda kullanılabilen Kumru; RAG tabanlı sohbet sistemleri, doküman özetleme, çağrı merkezi analitiği ve sosyal medya içerik üretimi gibi birçok alanda etkinlik göstermektedir.
YERLİ YAPAY ZEKA KUMRU'NUN ÖZELLİKLERİ
Türk mühendisler tarafından geliştirilen Kumru LLM, tamamen Türkçe için eğitilmiş ilk büyük dil modeli olma özelliği taşımaktadır. Model, doğal dil işleme alanında yüksek performans, verimlilik ve yerelleştirme yeteneği ile dikkat çekiyor.
TEKNİK ÖZELLİKLER
Parametre sayısı: 7,4 milyar
Eğitim verisi: 300 milyar Türkçe token, 500 GB veri
Tokenizer: Yalnızca Türkçe için özel olarak eğitilmiş tokenizer (çok dilli modellere göre %90’a kadar daha verimli)
Model tipi: Büyük dil modeli (LLM)
Eğitim dili: Tamamen Türkçe
YETKİNLİKLER
Metin üretimi, özetleme, yeniden yazma
Soru-cevap sistemleri
Konuşma ve diyalog oluşturma
Doküman analizi ve özetleme
Chatbot ve müşteri destek uygulamaları
Sosyal medya içerik önerisi ve üretimi
KULLANIM ALANLARI
Araştırma ve akademik çalışmalar
Kurumsal yapay zekâ çözümleri
Çağrı merkezi analitiği
RAG tabanlı bilgi yönetimi sistemleri
Türkçe odaklı içerik üretimi ve medya uygulamaları