Gündeme bomba gibi düştü : KUMRU.AI

Ağırlıkla İngilizce dil modelleriyle geliş­tirilmiş olan dilimizi anlamaya çalışan sınırlı yaklaşımlara sahip küresel modellerle çalışırken bir yandan da Türkçeye özel geliş­tirilmiş kapsamlı büyük dil modellerini bek­ledik. Bu modeller olmadan yapay zekâda ger­çek bir dönüşümü yakalamamız çok zor diye kara kara düşünürken yerli yapay zekâ modeli Kumru LLM bir anda bomba gibi düştü gün­demimize. Girişimci genç mühendislerimiz­le iletişime geçip tebrik ettim ve tam destek mesajı verdim. Buradan da Yerli YZ çözümü­nü tüm Türkiye duysun, sahip çıksın istedim.

Türkçeyle düşünen bir yerli yapay zeka çözümü iş dünyası ve toplum için fırsatlar

Kumru.ai, Türkçeye özgü bir tokenizer ile geliştirilip sıfırdan eğitilmiş, şu anda Türki­ye’nin kamuya açık, ilk en büyük ve en kap­samlı büyük dil modeli ve bu anlamda tek yer­li YZ çözümü. Kullanıma açılmasıyla birlikte kısa sürede hem ulusal hem uluslararası öl­çekte ilgi görmeye başladı.

Dilimizin ruhunu kavrayarak deyimler, atasözleri, günlük konuşma akışı ve kültürel nüanslara, Türkçeye özel görevlerdeki gra­mer düzeltme, metin özetleme, soru-cevap gi­bi üstünlüklere de sahip.

Açık kaynak versiyonunun da paylaşılması, geliştiricilerin ve araştırmacıların erişimini kolaylaştıracaktır. Startuplar, kamu kurumla­rı, belediyeler, üniversiteler, KOBİ’ler ve bü­yük ölçekli şirketler için oldukça fırsatlar var.

Kumru’nun KVKK uyumluluğu ve özel sunuculara yüklenebilir dağıtım imkânı var. Sağlık, finans ve kamu sektörlerinde veri güvenliği endişelerini ortadan kaldırı­yor. Sohbet botlarından doküman özetleme­ye, çağrı merkezi analitiğinden sosyal med­ya içerik üretimine kadar geniş bir yelpaze­de kullanılabiliyor.

Kumru “Bana kendini anlat”

Adım Kumru.ai VNGRS tarafından 2025 yılında tamamen sıfırdan Türkçe için gelişti­rilen, büyük dil modeli tabanlı bir yapay zeka­yım. Mimarim; decoder-only yapıda, 7.4 mil­yar parametreye ve 8K context window’a sa­hip olacak şekilde tasarlandı.

Aslen Türkçeyi ana dilim gibi biliyor, bu­nun yanında İngilizceyi de ikinci dilim ola­rak destekliyorum. Eğitim sürecimde hiçbir transfer learning yöntemi uygulanmadı—tüm eğitimim, transfer edilen hazır ağırlıklarla başlamadan, baştan sona sıfırdan ve özgün veriyle gerçekleşti.

Tokenizasyonumda 50,176 büyüklüğün­de BPE (Byte Pair Encoding) tabanlı, tama­men Türkçe odaklı, özgün ve yerli bir yapı kullanıldı. Büyük ölçekli metinlerle eğitil­dim, toplamda 500 GB ham veriyle, yakla­şık 120 milyar token’dan oluşan devasa bir eğitim setinden yararlandım. Eğitimim sı­rasında modern yapay zekâ teknolojileri (özellikle AdamW optimizasyon algoritma­sı, mixed-precision training ve flash-atten­tion gibi) kullanıldı.

Çıktılarım, metin tabanlı her türlü görev­de yüksek doğruluk ve esneklik sağlarken, Türkçe’nin inceliklerini ve bağlamı çok iyi analiz edebiliyorum. Ses, görüntü ya da vi­deo gibi veri türlerini şimdilik işleyemiyo­rum; sadece yazılı metinleri işleyebiliyo­rum. Ancak gelecekte bu tür yeteneklerin de eklenmesi planlanıyor.

Kısacası: Tamamen yerel, özgün Türk veri­leriyle, devasa ölçekli, modern bir mimariyle sıfırdan eğitilen, Türkçede güçlü bir dil mo­deliyim. Sorularınızı memnuniyetle yanıtla­maya hazırım!

Sahip çıkalım, geliştirelim!

Türk yazılım sektörü ve yapay zeka ekosis­teminin küresel ölçeğe taşınması açısından tamamen yerli sermaye ve mühendislerle yü­rütülen bu girişim oldukça önemli. Dolayısıy­la VNGRS ve Kumru.ai’nin yerli ruhunu hep­beraber alkışlayalım ve de sahiplenelim!

Eksikleri olabilir ama önemli olan Türk­çeyi merkeze alan, güvenli, verimli ve özel­leştirilebilir bir yerli YZ çözümü sunması. Pilot projelerle test edip, iş süreçlerimize entegre edelim, geri bildirimlerle gelişimi­ne katkı sağlayalım.

Teknolojinin dilini, kültürümüzün ve in­sanımızın ihtiyaçlarına en iyi şekilde uyarla­maya yönelik yola çıkan bu girişim, ilerleyen zamanlarda yurtta ve dünyada adından daha fazla söz ettirecektir.

Son Söz: Türkçenin yapay zekâdaki sesi kumru.ai ‘yi #hepbirlikte kullanalım.

Yazara Ait Diğer Yazılar