Пайкараи миллии забони тоҷикӣ (ПМЗТ)

Ин манбаъ пайкараи хаттии забони тоҷикиро ба миқдори 31 миллион вожа дар бар мегирад. Ҳиссаи коркарди автоматӣ 96%-ро ташкил медиҳад. Ҳар як шакли калимаи таҳлилшаванда бо маълумоти грамматикӣ ва тарҷума ба забони русӣ ва англисӣ таъмин гардидааст.

Маблағгузорӣ

Таҳия ва рушди пайкара аз ҳисоби манбаъҳои зерин маблағгузорӣ карда мешавад:

Таркиби пайкара

Дар айни замон ин пайкара асарҳои муосирро, ки дар асрҳои ХХ ва ХХI ба забони адабии тоҷик нашр ёфтаанд, дар бар мегирад. Дар пайкара жанрҳои зерин муаррифӣ мешаванд: наср, назм, драма, публитсистика, адабиёти илмӣ ва таълимӣ, ёддоштӣ-библиографӣ, динӣ, сиёсӣ, ҳуқуқӣ ва рӯзномаҳо. Таносуби фоизӣ аз рӯи жанрҳо чунин аст:

Рӯйхати пурраи асарҳое, ки ба Пайкараи миллии забони тоҷикӣ дохил карда шудаанд, дар саҳифаи дуюми равзана ҳангоми зер кардани тугмачаи "Интихоби зерпайкара" пайдо мешавад.

Хусусиятҳои пайкара

Дар раванди таҳияи пайкара усули коркарди автоматӣ тавассути барномаи таҳлилгари морфологӣ истифода бурда шудааст. Таҳлилгарро Т.А. Архангелский ҳамчун воситаи барномавии универсалӣ барои таҳияи пайкараҳои забонӣ омода кардааст ва он аз миёнаҳои солҳои 2000 дар ҷараёни сохтани як қатор пайкараҳо бомуваффақият амалӣ гардидааст. Ин пайкараҳо дар мавқеи дастрасии озод қарор доранд. Дар байни пайкараҳои дигари забонҳои эронӣ пайкараи миллии осетинӣ (http://corpus.ossetic-studies.org/) ва пайкараи хаттии лаҳҷаи дигории забони осетиниро (http://corpus-digor.ossetic-studies.org/) қайд кардан лозим аст.

Системаи коркарди автоматии таҳлил аз раванди лемматизация (аслгардонӣ)-и калима ва қайди нишонаҳои морфологӣ иборат мебошад. Дар лемматизатсия ба ҳар як шакли калима сарвожа, яъне шакли луғавии он, мувофиқ карда мешавад. Дар пайкараи забони тоҷикӣ барои ҳар як шакли калима, ғайр аз шакли луғавии он, маъноҳои асосии вожа ба забони русӣ ва англисӣ низ нишон дода шудааст. Барои тарҷума аз забони тоҷикӣ ба русӣ “Луғати тоҷикӣ-русӣ” зери таҳрири М.В. Раҳимӣ ва Л.В. Успенская (М: Нашри давлати луғатҳои хориҷӣ ва миллӣ, 1954) ва “Фарҳанги тоҷикӣ ба русӣ” зери таҳрири Д.Саймиддинов, С.Д.Холматова, С.Каримов (Нашри дуввум бо илова, такмил ва ислоҳ. Душанбе: Пайванд, 2006) истифода шудааст. Лемматизатсия коркарди мустақими луғати тоҷикӣ-русиро дар назар дорад. Қайди нишонаҳои морфологӣ маънои таъмин кардани ҳар як калима бо маълумоти грамматикӣ ва синтаксикӣ (ҳиссаи нутқ, сиға, замон, шахс, шумора ва ғайра)-ро дорад. Қоидаҳо ва мутобиқкунии қайди нишонаҳои морфологӣ мустақиман бидуни истифодаи системаҳои автоматии компютерӣ таҳия шудаанд.

Дар айни замон, ҳиссаи маводи ба таври автоматӣ ҷудошуда 96%-ро ташкил медиҳад.

Барои пайкара системаи ҷустуҷӯии универсалӣ, ки онро T.A. Архангельский таҳия кардааст, мутобиқ гардонда шудааст. Ҷустуҷӯ аз рӯи вожаҳо, шакли калимаҳо, зернишонаи луғавии тарҷума ва инчунин аз рӯи хусусиятҳои грамматикӣ имконпазир мебошад (рӯйхати пурраи глоссҳо бо рамзҳояш ниг. поёнтар). Барои ҷустуҷӯи дақиқтар имконияти омезиши дархостҳо аз рӯи параметрҳои гуногун вуҷуд дорад. Системаи ҷустуҷӯ имкон медиҳад, ки якчанд элементҳои забониро бо масофаи муайяни байни онҳо, инчунин дар зерпайкара, яъне дар матнҳои интихобкарда (масалан, танҳо дар матнҳои як жанр ё давраи муайян, дар матнҳои муаллиф ё муаллифони муайян) ҷустуҷӯ намоед. Имконияти мутобиқкунии маводи матлуб низ пешбинӣ шудааст.

Барои фаҳмидани имкониятҳои дигари ҷустуҷӯ, аломати саволеро, ки дар қисми болои саҳифа ҷойгир шудааст, пахш бояд кард.

Бо мақсади пешгирии вайронкунии ҳуқуқи муаллиф матнҳои пурра дастраси истифодабаранда намешавад. Дастрасӣ ба матн бо 7 ҷумла маҳдуд мебошад.

Вориди аломатҳои махсус

Барои ворид кардани ҳарфҳои тоҷикие, ки дар клавиатураи русӣ нестанд, аз комбинатсияи аломатҳои зерин истифода бурдан мумкин аст:

Табдили ҳуруф

Соли 2021 табдили ҳуруфи кириллии тоҷикӣ ба ҳуруфи лотинӣ ба анҷом расонида шуд. Барои табдили ҳуруф аз тоҷикӣ ба лотинӣ дар канори болоии чапи саҳифаи Ҷустуҷӯ Option,Transliteration, latin - ро интихоб кунед.

Барои вориди ҳуруфи лотинӣ дар канори болоии чапи саҳифаи асосии Ҷустуҷӯ Option, Character input method, inputmethod_latin -ро интихоб кунед.

Дар поён рӯйхати мувофиқати ҳуруфи лотинӣ ба тоҷикӣ, ки дар вақти ҷустуҷӯ истифода кардан мумкин аст, оварда шудааст:

Соли 2021 ҳамчунин клавиатураи виртуалӣ барои чопи маводи забони тоҷикӣ ворид карда шуд. Барои гирондани клавиатураи виртуалӣ ба майдони Word ё Lemma ворид шавед ва онро пайдо карда метавонед.

Рӯйхати аломатҳои грамматикӣ

(майдони Грамматика/Grammar дар ҷустуҷӯ)

Диққат! Хангоми ҷустуҷӯ регистри аломатҳоро риоя кунед:

Созандагони пайкара

Пайкара дар натиҷаи кори муштараки мутахассисони тоҷик ва рус таҳия шудааст. Ҷамъоварӣ, рақамикунонӣ ва коркарди матнҳо ба забони тоҷикӣ аз ҷониби як гурӯҳ олимони кафедраи забоншиносии назариявӣ ва амалӣ (Д.М. Искандарова, Х.Д. Шамбезода, М.Б. Давлатмирова, О.Л. Козлова) ва кафедраи информатика ва системаҳои иттилоотии (З.Д. Усмонов, М.А. Умаров) Донишгоҳи (Славянии) Россия ва Тоҷикистон, инчунин олимони Донишгоҳи давлатии ҳуқуқ, тиҷорат ва сиёсати Тоҷикистон дар Хуҷанд (Г. Довудов, А. Қосимов) иҷро карда шуданд.

Шакли ниҳоии матнҳо пеш аз ба пайкара илова кардани онҳо аз ҷониби A.П Видрин коркард мешавад.

Луғати забони тоҷикиро A.П Видрин, А.Д.Егорова ва И.В. Егоров коркард ва танзим кардаанд. Таҳлилгари морфологии тоҷикӣ аз ҷониби A.P. Видрин танзим шудааст. Системаи вижагиҳои грамматикӣ (майдони Грамматика барои ҷустуҷӯ) ва глосс (майдони Gloss дар ҷустуҷӯ)- ро низ А.П. Видрин таҳия кардааст.

Аз соли 2021 инҷониб дар пайкара тарзи коркарди қариб ҳамаи шаклҳои таҳлилии феълҳои забони тоҷикӣ аз ҷониби А.П. Видрин, Т.А. Архангелский ва А.В. Панасюк ба анҷом расонда шуд.

Ҳифзи дарсади тақсимоти автоматӣ аз ҷониби A.P. Видрин роҳандозӣ мешавад.

Аз соли 2020 инҷониб барои дастгирии техникӣ, инчунин зеркашӣ ва коркарди ниҳоии матнҳои рӯзномаҳо дар пайкара А.В.Панасюк саҳм мегирад.

Миннатдорӣ

Миннатдории худро ба A.A. Меликов, ки матнҳои муаллифони муосири тоҷикзабонро (тақрибан 200 китоб) аз нашрияҳои шаҳрҳои Душанбе, Самарқанд ва Тошканд ҷамъ овардааст ва Б. Олимов (130 китоб) барои пешкаш намудани маҷмӯаҳо баён мекунем. Инчунин аз магистрантҳои шуъбаи забоншиносии назариявӣ ва амалӣ ва донишҷӯёни Донишгоҳи (Славянии) Россия ва Тоҷикистон, ки шумораи зиёди матнҳоро кор карда баромаданд (хусусан Манижа Сохибова ва Ҳаммод Муборакшо) миннатдорем. Мо инчунин аз T.A. Архангелский, ки оиди хусусиятҳои таҳлилгарҳои худ машварат гузаронид ва пайкараи тоҷикро дар интернет ҷойгир кард, сипосгузорем.

Маълумот барои тамос

Лутфан ҳар гуна эрод ва пешниҳоди худро ба Арсений Павлович Видрин ба суроғаи электронии senjacom@gmail.com фиристед.

Дурнамои рушди пайкара

Дар соли 2022 таҳияи пайкараи адабиёти классикии тоҷику форси асрҳои IX-XIX ба нақша гирифта шудааст. Васеъ кардани пайкараи мавҷудаи матнҳои муосир тавассути ворид кардани матнҳои нав, инчунин мукаммалгардонии сифат ва зиёд кардани теъдоди калимаҳои автоматӣ таҳлилшаванда низ дар назар аст. Таҳиягарони пайкара аз омода ва пешкаш кардани матнҳои нав ба забони тоҷикӣ барои дохил кардан ба пайкара миннатдор хоҳанд буд.

Матнҳо ба суроғаҳои: lingvistik.rtsu@gmail.com ва senjacom@gmail.com дар ҳама гуна формати матн қабул карда мешаванд (doc, docx, rtf, txt, odt).

Мо кафолат медиҳем, ки ҳуқуқи муаллифон риоя ва матнҳои ирсолшуда танҳо барои таҳия ва рушди Пайкараи миллии забони тоҷикӣ истифода хоҳанд шуд.