Пайкараи миллии забони тоҷикӣ (ПМЗТ)

Ин манбаъ пайкараи хаттии забони тоҷикиро ба миқдори 12 миллион вожа дар бар мегирад. Ҳиссаи коркарди автоматӣ 91%-ро ташкил медиҳад. Ҳар як шакли калимаи таҳлилшаванда бо маълумоти грамматикӣ ва тарҷума ба забони русӣ таъмин гардидааст.

Маблағгузорӣ

Таҳия ва рушди пайкара аз ҳисоби манбаъҳои зерин маблағгузорӣ карда мешавад:

Таркиби пайкара

Дар айни замон ин пайкара асарҳои муосирро, ки дар асрҳои ХХ ва ХХI ба забони адабии тоҷик нашр ёфтаанд, дар бар мегирад. Дар пайкара жанрҳои зерин муаррифӣ мешаванд: наср, назм, драма, публитсистика, адабиёти илмӣ ва таълимӣ, ёддоштӣ-библиографӣ, динӣ, сиёсӣ, ҳуқуқӣ ва рӯзномаҳо. Таносуби фоизӣ аз рӯи жанрҳо чунин аст:

Рӯйхати пурраи асарҳое, ки ба Пайкараи миллии забони тоҷикӣ дохил карда шудаанд, дар саҳифаи дуюми равзана ҳангоми зер кардани тугмачаи "Интихоби зерпайкара" пайдо мешавад.

Хусусиятҳои пайкара

Дар раванди таҳияи пайкара усули коркарди автоматӣ тавассути барномаи таҳлилгари морфологӣ истифода бурда шудааст. Таҳлилгарро Т.А. Архангелский ҳамчун олоти барномавии универсалӣ барои таҳияи пайкараҳои забонӣ омода кардааст ва он аз миёнаҳои солҳои 2000 дар ҷараёни сохтани як қатор пайкараҳо бомуваффақият амалӣ гардидааст. Ин пайкараҳо дар мавқеи дастрасии озод қарор доранд. Дар байни пайкараҳои дигари забонҳои эронӣ пайкараи миллии осетинӣ (http://corpus.ossetic-studies.org/) ва пайкараи хаттии лаҳҷаи дигории забони осетиниро (http://corpus-digor.ossetic-studies.org/) қайд кардан лозим аст.

Системаи коркарди автоматии таҳлил аз раванди лемматизация (аслгардонӣ)-и калима ва қайди нишонаҳои морфологӣ иборат мебошад. Дар лемматизатсия ба ҳар як шакли калима сарвожа, яъне шакли луғавии он, мувофиқ карда мешавад. Дар пайкараи забони тоҷикӣ барои ҳар як шакли калима, ғайр аз шакли луғавии он, маъноҳои асосии вожа ба забони русӣ низ нишон дода шудааст (аз рӯи Луғати тоҷикӣ-русӣ, дар зери таҳрири М.В. Раҳимӣ ва Л.В. Успенская. М: Нашриёти давлатии луғатҳои хориҷӣ ва миллӣ, 1954). Лемматизатсия коркарди мустақими луғати тоҷикӣ-русиро дар назар дорад. Қайди нишонаҳои морфологӣ маънои таъмин кардани ҳар як калима бо маълумоти грамматикӣ ва синтаксикӣ (ҳиссаи нутқ, сиға, замон, шахс, шумора ва ғайра)-ро дорад. Қоидаҳо ва мутобиқкунии қайди нишонаҳои морфологӣ мустақиман бидуни истифодаи системаҳои автоматии компютерӣ таҳия шудаанд. Дар айни замон, ҳиссаи маводи ба таври автоматӣ ҷудошуда 91%-ро ташкил медиҳад.

Барои пайкара системаи ҷустуҷӯии универсалӣ, ки онро T.A. Архангельский таҳия кардааст, мутобиқ гардонда шудааст. Ҷустуҷӯ аз рӯи вожаҳо, шакли калимаҳо, зернишонаи луғавии тарҷума ва инчунин аз рӯи хусусиятҳои грамматикӣ имконпазир мебошад (рӯйхати пурраи глоссҳо бо рамзҳояш ниг. поёнтар). Барои ҷустуҷӯи дақиқтар имконияти омезиши дархостҳо аз рӯи параметрҳои гуногун вуҷуд дорад. Системаи ҷустуҷӯ имкон медиҳад, ки якчанд элементҳои забониро бо масофаи муайяни байни онҳо, инчунин дар зерпайкара, яъне дар матнҳои интихобкарда (масалан, танҳо дар матнҳои як жанр ё давраи муайян, дар матнҳои муаллиф ё муаллифони муайян) ҷустуҷӯ намоед. Имконияти мутобиқкунии маводи матлуб низ пешбинӣ шудааст.

Бо мақсади пешгирии вайронкунии ҳуқуқи муаллиф матнҳои пурра дастраси истифодабаранда намешавад. Дастрасӣ ба матн бо 7 ҷумла маҳдуд мебошад.

Созандагони пайкара

Пайкара дар натиҷаи кори муштараки мутахассисони тоҷик ва рус таҳия шудааст. Ҷамъоварӣ, рақамикунонӣ ва коркарди матнҳо ба забони тоҷикӣ аз ҷониби як гурӯҳ олимони кафедраи забоншиносии назариявӣ ва амалӣ (Д.М. Искандарова, Х.Д. Шамбезода, М.Б. Давлатмирова, О.Л. Козлова) ва кафедраи информатика ва системаҳои иттилоотии (З.Д. Усмонов, М.А. Умаров) Донишгоҳи (Славянии) Россия ва Тоҷикистон, инчунин олимони Донишгоҳи давлатии ҳуқуқ, тиҷорат ва сиёсати Тоҷикистон дар Хуҷанд (Г. Довудов, А. Қосимов) иҷро карда шуданд.

Системаи универсалии таҳлили морфологии автоматии дар пайкара истифодашуда аз ҷониби Т.А.Архангелский таҳия шудааст ва ба таври ройгон дар интернет мавҷуд аст. Луғати забони тоҷикиро A.П Видрин ва И.В. Егоров коркард ва танзим кардаанд. Таҳлилгари морфологии тоҷикӣ аз ҷониби A.P. Видрин танзим шудааст.

Миннатдорӣ

Миннатдории худро ба A.A. Меликов, ки матнҳои муаллифони муосири тоҷикзабонро (тақрибан 200 китоб) аз нашрияҳои шаҳрҳои Душанбе, Самарқанд ва Тошканд ҷамъ овардааст ва Б. Олимов (130 китоб) барои пешкаш намудани маҷмӯаҳо баён мекунем. Инчунин аз магистрантҳои шуъбаи забоншиносии назариявӣ ва амалӣ ва донишҷӯёни Донишгоҳи (Славянии) Россия ва Тоҷикистон, ки шумораи зиёди матнҳоро кор карда баромаданд (хусусан Манижа Сохибова ва Ҳаммод Муборакшо) миннатдорем. Мо инчунин аз T.A. Архангелский, ки оиди хусусиятҳои таҳлилгарҳои худ машварат гузаронид ва пайкараи тоҷикро дар интернет ҷойгир кард, сипосгузорем.

Маълумот барои тамос

Бо дастгирии техникии пайкара Арсений Павлович Видрин машғул аст. Лутфан ҳар гуна эрод ва пешниҳоди худро ба senjacom@gmail.com фиристед.

Дурнамои рушди пайкара

Дар солҳои 2020-2021 таҳияи пайкараи адабиёти классикии тоҷику форси асрҳои IX-XIX ба нақша гирифта шудааст. Васеъ кардани пайкараи мавҷудаи матнҳои муосир тавассути ворид кардани матнҳои нав, инчунин мукаммалгардонии сифат ва зиёд кардани теъдоди калимаҳои автоматӣ таҳлилшававанда низ дар назар аст Таҳиягарони пайкара аз омода ва пешкаш кардани матнҳои нав ба забони тоҷикӣ барои дохил кардан ба пайкара миннатдор хоҳанд буд. Матнҳо ба суроғаҳои: lingvistik.rtsu@gmail.com ва senjacom@gmail.com дар ҳама гуна формати матн қабул карда мешаванд (doc, docx, rtf, txt, odt). Мо кафолат медиҳем, ки ҳуқуқи муаллифон риоя ва матнҳои ирсолшуда танҳо барои таҳия ва рушди Пайкараи миллии забони тоҷикӣ истифода хоҳанд шуд.