AZ

Milli Korpus və Az-LLM nə zaman yaradılacaq? Mütəxəssislər inamsızdır » AzadMedia.az

ChatGPT, LLaMA, Claude, Gemini və s. süni intellekt modelləri olduğu bir zamanda Az-LLM-ə ehtiyac varmı?

Baxıram ki, Qazaxıstan süni intellekt sahəsində bir az daha irəli gedərək özünün Böyük Dil Modelini (Kaz-LLM) yaradıb və açıq istifadə üçün də maraqlı tərəflərə təqdim edib.
Maraqlıdır ki, Kaz-LLM Qazax, Rus və İngilis dillərində məzmun yarada bilir.
Kaz-LLM Türk dillərinə uyğunlaşdırılmış ilk böyük model hesab oluna bilər !
Modelin təlimi üçün 150 milyarddan çox token toplandığını bildiriblər. Daha az resurs tələb edən mühitlər üşün də versiyaları hazırlanıb və resurslar Hugging Face platformasında yerləşdirilib.

Əvvəllər də qeyd etmişdim, Azərbaycanda pərakəndə formada bir neçə süni intellekt layihələri icra edilməkdədir. eSatınalma-dan da görsənir ki, ötən ildən başlayarq dövlət qurumları bu sahəyə yatırımlar edir.
RİNN süni intellektin inkişafı ilə bağlı strategiyanın hazır olduğunu və hökumətə təqdim edildiyini bildirib.
İN isə daha irəli gedərək süni intellekt infrastrukturunun qurulması üçün, hamının istifadə edə biləcəyi Superkompüter Mərkəzinin qurulması üçün, NVİDİA-dan çiplərin alınması üçün 10 milyon manat investisiya ayırıb. Artıq çiplərin alındığı, Mərkəzin qurulmasına start verildiyi bildirilir.

Lakin bu sahədə bizdə pərakəndəlik və ləngimələr açıq-aşkar görsənir.
Hazırda Azərbaycanda NLP və LLM sahəsində sistemli fəaliyyət və vahid strategiya yoxdur. Dövlət qurumları müəyyən addımlar atsa da, hələ də Milli Korpus və Az-LLM modeli mövcud deyil. Sadəcə AMEA və ETN-in bəzi universitetlərində müəyyən tədqiqatlar aparılır.
Bəzi şirkətlər, müstəqil tədqiqatçılar və fiziki şəxslər, proqramçılar Azərbaycan dilinin işlənməsi və təbii dilin emalı üzrə müəyyən layihələr və tətbiqlər üzərində işlər görür.

Milli Korpus, Ana dilimizdə süni intellekt həllərinin və NLP ( təbii dilin emalı) layihələrin inkişafı üçün, mətnlərin emalı və riyazi-statistik təhlili üçün, kompüter dilçiliyinin inkişafı üçün bir nömrəli məsələdir.
O zamankı Rabitə və Yüksək Texnologiyalar Nazirliyinin dəstəyilə Dilmanc layihəsi çərçivəsində müəyyən addımlar atılsa da, bu layihə çərçivəsində toplanmış datanın Nazirliyə verildiyi bildirilsə də, hamı üçün əlçatan olan resurs indiyədək də ortada yoxdur.
Əgər bu yoxdursa onda Az-LLM-dən danışmaq ümumiyyətlə yersizdir. Keyfiyyətli və zəngin Milli Korpus əsasında , Azərbaycan dilində mətnlər yaratmaq, suallara cavab vermək, məzmunu analiz etmək və avtomatik tərcümə və s. bu kimi funksiyaları yerinə yetirə bilən keyfiyyətli bir süni intellekt modelinin – Az-LLM-in yaradılması çox vacibdir.
Fikrimcə, Az-LLM-in yaradılması strateji əhəmiyyət daşıyır.

Düşünürəm ki, Azərbaycan dilinin qorunması və spesifikliyi baxımından, onun rəqəmsal mühitdə inkişafı, xüsusilə də təhlükəsizlik baxımından Az-LLM zəruridir.
Az-LLM Azərbaycanın süni intellekt sahəsində irəliləyişi üçün əsas baza olmalı və dilimizin qlobalda daha geniş istifadəsini təmin etməlidir.
Bunun reallaşması üçün bütün maraqlı tərəflər, dövlət qurumları, universitetlər və tədqiqatçıar, biznes bir araya gəlməlidir.

Bildiyim qədər İRİA bu yaxınlarda maraqlı tərəflərin iştirakı ilə bu istiqamətdə işlərə başlamağı hədəfləyib.
Azadmedia.az xəbər verir ki, bu aktual məqaləni Osman Gündüz sosial media hesabında yazıb.
Professor Qulu Məhərrəmli və təhsil eksperti İsmayıl Sadıqlı ikt ekspertinin fikirlərini bəyənsələr də, reallaşacağına inanmırlar.
"Bildiyim qədər İRİA bu yaxınlarda maraqlı tərəflərin iştirakı ilə bu istiqamətdə işlərə başlamağı hədəfləyib." İllərdir ki, biri hədəfləyir, biri "start verir", ancaq ortada bir şey yoxdur", -İsmayıl Sadıqlı yazıb.
Qulu müəllimin yamaşması da maraq doğurur:
"Olduqca vacib… və (resurslar, texnologiya, maliyyə və koordinasiya baxımından) bir o qədər də çətin vəzifədir.
Məsələn, Rafiq İsmayılovla azleks.az-ı yeniləmiş, xeyli faydalı və əlçatan etmişik. Milli korpusun yaradılmasında bu resurs ciddi rol oynaya bilər, amma siz yazan və İsmayıl müəllim vurğulayan səbəbdən irəliləmək mümkün deyil..."

Seçilən
18
4
azadmedia.az

5Mənbələr