Azərbaycan dilində süni intellekt və NLP-nin inkişafı üçün layihə hazırlanıb
 
 Biz bir neçə gəncdən ibarət komanda Azərbaycan dilində süni intellekt və NLP-nin inkişafı üçün layihə hazırlayıb.
Komandanın üzvü Kənan Süleymanlının Marja-ya təqdim etdiyi məlumatda bildirilir ki, son günlərdə süni intellekt və NLP (təbii dil işlənməsi, ing., “natural language processing”) bütün dünyada trend olduğunun şahidi oluruq. Xüsusilə, ChatGPT kimi söhbət botlarının hər kəsimdən şəxsin istifadəsində olması bu sahəni daha maraqlı edir. Bir çox sahədə olduğu kimi sözügedən sahələrdə də əksər tədqiqat işləri ingilis dili kimi yüksək resurslu dillərlə aparılmasına, az resurslu dillər üçün bu kimi sahələrdə ikinci planda olduğuna şahid olmaqdayıq. Ana dilimiz də bu az resurslu dillər siyahısında olduğundan süni intellekt və NLP kimi sahələrdə ana dilimizdə resurs və alət tapmaq demək olar ki, mümkün deyildi. Lakin son günlərdə bir neçə gəncdən ibarət komandanın hazırladığı NLP üçün ən vacib detallardan biri olan azərbaycanca korpus bu sektordan olan hər kəsin marağını cəlb etməkdədir.
Müxtəlif NLP layihələrində (mətn yaratma, çatbotlar və s.) istifadə oluna biləcək “azcorpus” Azərbaycan dilində ümumilikdə 1,9 milyon mətndən və təqribən 18 milyon cümlədən ibarətdir. Mətnlər xəbər saytları, jurnallar, vikipediya məqalələri, kitablar daxil olmaqla müxtəlif mənbələrdən seçilmişdir və siyasət, iqtisadiyyat, elm, mədəniyyət, idman, tarix, cəmiyyət və s. o cümlədən bir sıra digər mövzuları əhatə edən mətnlərlə janr və mövzu üzrə əhatə olunub.
Ən əsası isə, “azcorpus” təkcə bədii ədəbiyyat deyil, həm də fizika, kimya və s. kimi elmi mətnləri də əhatə edəcək şəkildə genişləndirilib.
“Azcorpus”da hal-hazırda 3 müxtəlif mənbədən götürülmüş (az_books, az_wiki və az_news) və təmizlənmiş toplamda 1,876,492 sənəd var. Hazırda korpusun ümumi həcmi 23.4 GB təşkil edir. Müqayisə üçün qeyd edək ki, hal-hazırda trend olan GPT-3 modeli müxtəlif mənbələrdən toplanmış 800 GB həcmli data, GPT-2 modeli isə 40 GB data üzərində öyrədilib.
Korpus üzərində işləyən komanda bildirir ki, bu korpusu geniş ictimaiyyət üçün əlçatan etməklə onlar Azərbaycan dilində NLP həllərinin yaradılması üçün gələcək tədqiqat və inkişafı stimullaşdırmağa, eyni zamanda dil müxtəlifliyi və mədəni irsin təşviqi kimi daha geniş məqsədə töhfə verməyə ümid edirlər.
Korpusdan istifadə etmək üçün bu linkidən istifadə edə bilərsiniz.
Marja.az-ın Telegram kanalına qoşulun və xəbərlər cibinizə gəlsin.
♦️ Ən son və vacib iqtisadi xəbərlər üçün Marja - Biznes və Maliyyə Xəbərləri Portalı
♦️ Ən mühüm xəbərlər üçün Marja.az
Müştərilərin xəbərləri
 
                        Abşeron Ticarət Mərkəzində yerləşdirmiş sahibkarların dövlət proqramlarından istifadə imkanları müzakirə edilib
SON XƏBƏRLƏR
- 1 ay sonra
- 1 ay sonra
- 
                     9 saat əvvəl
                    Azərbaycanda möhtəşəm Memarlıq və Dizayn Qala Gecəsi keçiriləcək 
- 
                         📲 İndi
 Marja.az-ın Telegram kanalına qoşulun və xəbərlər cibinizə gəlsin.
 ♦️ Ən son və vacib iqtisadi xəbərlər üçün Marja - Biznes və Maliyyə Xəbərləri Portalı
 ♦️ Ən mühüm iqtisadi xəbərlər üçün Marja.az
- 10 saat əvvəl
- 10 saat əvvəl
- 
                     10 saat əvvəl
                    Starbucks üçün qəhvə çatdırılması xidməti artıq 1 milyard dollarlıq biznesə çevrilib 
- 
                     10 saat əvvəl
                    Qazax və Qusarda dövlət ehtiyacları üçün torpaq sahələri alınacaq 
- 11 saat əvvəl
- 11 saat əvvəl
- 11 saat əvvəl
- 
                     11 saat əvvəl
                    Azadlıq Meydanındakı yeraltı avtodayanacağın fəaliyyəti müvəqqəti dayandırılacaq 
- 
                     11 saat əvvəl
                    Azərbaycanda “Huawei”nin həllərinin təqdim edilməsi məsələləri müzakirə olunub 
Son Xəbərlər
 
                                    Azərbaycanda Vakansiyalar - Azvak.az
 
                                    Azərbaycanda möhtəşəm Memarlıq və Dizayn Qala Gecəsi keçiriləcək
 
                                    Avropa Mərkəzi Bankı faiz qərarını açıqladı
 
                                Qazax və Qusarda dövlət ehtiyacları üçün torpaq sahələri alınacaq
 
                                Çin ABŞ-dan hər il 25 milyon ton soya alacaq
 
                                Dolların sabah üçün rəsmi məzənnəsi müəyyən olunub
Ən çox oxunanlar
 
                                Misli.az-da böyük uduş: 1 manatlıq mərc 194 min manat qazandırıb
 
                                Türkiyə Mərkəzi Bankının ehtiyatları rekord səviyyədən geriləyib: 13 milyard dollar azalıb
 
                                “Azexport” və “QazTrade” arasında Anlaşma Memorandumu imzalanıb
 
                                İcra başçısı vəzifədən azad olundu
 
                                

 
                         
                    






 
                             
                             
                            



.jpg)
 
                                     
                                     
                                     
                                    




