Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği ile Yapay Zeka ve Veri Mühendisliği Bölümü Öğretim Üyesi Prof. Dr. Mehmet Fatih Amasyalı öncülüğünde akademisyenlerden oluşan Cosmos ekibi, Türkçe düşünen yapay zeka Cosmos T1'i geliştirdi.
Model, matematiksel akıl yürütme performansını ölçen Türkçe GSM8K veri setinde yüzde 77,41 doğruluk oranına ulaştı. Cosmos T1, zincirleme akıl yürütme (chain-of-thought reasoning) yaklaşımıyla Türkçe matematik problemlerini çözebiliyor.
Turkish-Gemma-9b-T1 modeli, Türkçe GSM8K testinde yüzde 77,41 doğruluk oranına ulaştı. Aynı testte Gemma-2-9B modeli yüzde 63,10 ve Llama-3.1-70B modeli yüzde 66,13 performans gösterdi. 9 milyar parametreli model, 70 milyar parametreli Llama-3.1-70B modelinin üzerinde performans gösterdi. Parametre sayısı açısından kendisinden yaklaşık 8 kat büyük modellerle rekabet edebilecek seviyeye ulaştı.
Amasyalı: "Önce düşünme, sonra konuşma"
Cosmos ekibinin liderliğini yapan Prof. Dr. Mehmet Fatih Amasyalı, başarıyı modelin "önce düşünme sonra konuşma" yeteneğine bağladı. Aktarılanlara göre Cosmos T1, soruyu önce parçalara ayırarak adım adım zincirleme bir mantık kuruyor ve bu analizi arayüz üzerinden kullanıcıya da gösteriyor.
“Kendisinden 3 kat büyük modellerle yarışabiliyor”
Mehmet Fatih Amasyalı, "Cosmos T1 üzerine oldukça sağlam bir eğitim gerçekleştirdik ve onu düşünmeyen bir modelden düşünen bir model haline getirdik. Bu sayede de kendisinden 3 kat büyük olan modellerle yarışabilecek seviyeye ulaştı. Bu başarı da sosyal medyada epey ilgi gördü. Aslında çok isteyince ve çalışınca oluyor. Sağlam bir ekiple ve büyük bir motivasyonla bunları gerçekleştirdik. TÜBİTAK'ın arkamızda olması en büyük motivasyonumuzdu" dedi.
Açık kaynak ve yerel kurulum
Cosmos T1'in Hugging Face üzerinden açık kaynak olarak erişime sunulduğu, şirketlerin kendi iç ağlarına ve yerel bilgisayarlarına kurulabildiği belirtildi. Bu sayede kurumların verilerini internete çıkarmadan kapalı devre sistemlerde kullanabileceği ifade edildi.
Yorumlar
Kalan Karakter: