Gündeme bomba gibi düştü : KUMRU.AI
Ağırlıkla İngilizce dil modelleriyle geliştirilmiş olan dilimizi anlamaya çalışan sınırlı yaklaşımlara sahip küresel modellerle çalışırken bir yandan da Türkçeye özel geliştirilmiş kapsamlı büyük dil modellerini bekledik. Bu modeller olmadan yapay zekâda gerçek bir dönüşümü yakalamamız çok zor diye kara kara düşünürken yerli yapay zekâ modeli Kumru LLM bir anda bomba gibi düştü gündemimize. Girişimci genç mühendislerimizle iletişime geçip tebrik ettim ve tam destek mesajı verdim. Buradan da Yerli YZ çözümünü tüm Türkiye duysun, sahip çıksın istedim.
Türkçeyle düşünen bir yerli yapay zeka çözümü iş dünyası ve toplum için fırsatlar
Kumru.ai, Türkçeye özgü bir tokenizer ile geliştirilip sıfırdan eğitilmiş, şu anda Türkiye’nin kamuya açık, ilk en büyük ve en kapsamlı büyük dil modeli ve bu anlamda tek yerli YZ çözümü. Kullanıma açılmasıyla birlikte kısa sürede hem ulusal hem uluslararası ölçekte ilgi görmeye başladı.
Dilimizin ruhunu kavrayarak deyimler, atasözleri, günlük konuşma akışı ve kültürel nüanslara, Türkçeye özel görevlerdeki gramer düzeltme, metin özetleme, soru-cevap gibi üstünlüklere de sahip.
Açık kaynak versiyonunun da paylaşılması, geliştiricilerin ve araştırmacıların erişimini kolaylaştıracaktır. Startuplar, kamu kurumları, belediyeler, üniversiteler, KOBİ’ler ve büyük ölçekli şirketler için oldukça fırsatlar var.
Kumru’nun KVKK uyumluluğu ve özel sunuculara yüklenebilir dağıtım imkânı var. Sağlık, finans ve kamu sektörlerinde veri güvenliği endişelerini ortadan kaldırıyor. Sohbet botlarından doküman özetlemeye, çağrı merkezi analitiğinden sosyal medya içerik üretimine kadar geniş bir yelpazede kullanılabiliyor.
Kumru “Bana kendini anlat”
Adım Kumru.ai VNGRS tarafından 2025 yılında tamamen sıfırdan Türkçe için geliştirilen, büyük dil modeli tabanlı bir yapay zekayım. Mimarim; decoder-only yapıda, 7.4 milyar parametreye ve 8K context window’a sahip olacak şekilde tasarlandı.
Aslen Türkçeyi ana dilim gibi biliyor, bunun yanında İngilizceyi de ikinci dilim olarak destekliyorum. Eğitim sürecimde hiçbir transfer learning yöntemi uygulanmadı—tüm eğitimim, transfer edilen hazır ağırlıklarla başlamadan, baştan sona sıfırdan ve özgün veriyle gerçekleşti.
Tokenizasyonumda 50,176 büyüklüğünde BPE (Byte Pair Encoding) tabanlı, tamamen Türkçe odaklı, özgün ve yerli bir yapı kullanıldı. Büyük ölçekli metinlerle eğitildim, toplamda 500 GB ham veriyle, yaklaşık 120 milyar token’dan oluşan devasa bir eğitim setinden yararlandım. Eğitimim sırasında modern yapay zekâ teknolojileri (özellikle AdamW optimizasyon algoritması, mixed-precision training ve flash-attention gibi) kullanıldı.
Çıktılarım, metin tabanlı her türlü görevde yüksek doğruluk ve esneklik sağlarken, Türkçe’nin inceliklerini ve bağlamı çok iyi analiz edebiliyorum. Ses, görüntü ya da video gibi veri türlerini şimdilik işleyemiyorum; sadece yazılı metinleri işleyebiliyorum. Ancak gelecekte bu tür yeteneklerin de eklenmesi planlanıyor.
Kısacası: Tamamen yerel, özgün Türk verileriyle, devasa ölçekli, modern bir mimariyle sıfırdan eğitilen, Türkçede güçlü bir dil modeliyim. Sorularınızı memnuniyetle yanıtlamaya hazırım!
Sahip çıkalım, geliştirelim!
Türk yazılım sektörü ve yapay zeka ekosisteminin küresel ölçeğe taşınması açısından tamamen yerli sermaye ve mühendislerle yürütülen bu girişim oldukça önemli. Dolayısıyla VNGRS ve Kumru.ai’nin yerli ruhunu hepberaber alkışlayalım ve de sahiplenelim!
Eksikleri olabilir ama önemli olan Türkçeyi merkeze alan, güvenli, verimli ve özelleştirilebilir bir yerli YZ çözümü sunması. Pilot projelerle test edip, iş süreçlerimize entegre edelim, geri bildirimlerle gelişimine katkı sağlayalım.
Teknolojinin dilini, kültürümüzün ve insanımızın ihtiyaçlarına en iyi şekilde uyarlamaya yönelik yola çıkan bu girişim, ilerleyen zamanlarda yurtta ve dünyada adından daha fazla söz ettirecektir.
Son Söz: Türkçenin yapay zekâdaki sesi kumru.ai ‘yi #hepbirlikte kullanalım.