Материалы

Нейрочелтәрләр нигезендә яңа рус-татар тәрҗемәчесе булдырылды

последние и лучшие новости искусства в мире

Tatsoft проекты Татарстан Республикасы фәннәр академиясенең гамәли семиотика институты хезмәткәрләре тарафыннан, Иннополис университеты ассистенты Альбина Хөсәенова катнашында эшләнгән. Күнегүләр өчен нейрочелтәр уйлап табучылар миллион пар тәкъдим җыйган.

Тәрҗемәче архитектурасы нейрочелтәр технологияләренә нигезләнгән. Альбина Хөсәенова һәм Татарстан фәннәр академиясе хезмәткәре Айдар Хөсәенов бу өлкәдә фәнни трендларның кулланылышын тикшереп, төрле модельләрне сынадылар һәм комбинацияләделәр. Финалда, нейрочелтәр мәгълүматлар - китаплар тәрҗемә итәргә, билингваль яңалыкларга һәм һөнәри тәрҗемәчеләр тарафыннан тәрҗемә ителгән текстларга өйрәнгән вакытта, - эшләүчеләр сервис кулланучыларның зур трафигына түзсен өчен, өстәмә йөкләндерелгән (нагрузочное) тест үткәрделәр.

Тәрҗемәчене булдыру буенча эш 5 ел дәвам итте: 2014 елдан гамәли семиотика институтында мәгълүматлар җыелды һәм цифрлаштырылды, оптималь эш өчен автоматлаштырылган тәрҗемә модельләре өйрәнелде, 2018 ел башында сервисның беренче версиясе барлыкка килде. 2019 елда эшкә Россия мәгълүмати технологияләр (ИТ) югары уку йортлары вәкилләре дә кушылды.

Альбина Хөсәенова әйтүенчә, элек аерым сүзләрне генә түгел, ә татар теленнән русчага яки киресенчә текстларны “Яндекс. Тәрҗемәче» сервисы гына тәрҗемә итә ала иде. Хәзер, BLEU (Bilingual Evaluation Understudy Score) метрикасы буенча тәрҗемә сыйфатын тикшерү нәтиҗәләре күрсәткәнчә, моны Tatsoft яхшырак башкара.

Тәрҗемәчене рәсми тәкъдир итү 25 октябрьдә узды. Tatsoft русчадан татар теленә дә, киресенчә дә тәрҗемә итә. Кулланучылар текстны синтезлы яңгырата һәм тәрҗемәне бәяли алалар. Якын арада мобиль кушымта чыгару, шулай ук күнегү парлары санын 15 миллионга кадәр арттыру планлаштырыла.

Иннополис Университеты лабораториясе ассистенты Альбина Хөсәенова: «Мин аз ресурслы машинада тәрҗемә итү проблемалары белән шөгыльләнәм һәм шуңа күрә, әлбәттә, бу проект мине бик кызыксындырды. Мин эшкә кушылганда күнегүләр өчен модельләр җыелган иде инде. Бу - Татарстанда эшләнгән һәм киң җәмәгатьчелек өчен уңайлы югары сыйфатлы машина тәрҗемәчесе. Мин үзем аннан актив файдаланам. Еш кына бик яхшы нәтиҗәләр бирә (мин үзем дә алай булдыра алмаган булыр идем), тик кайчагында, әлбәттә, проблемалар була. Алар, кагыйдә буларак, күнегү мәгълүматларында охшаш тәкъдимнәр булмаган вакытта барлыкка килә. Гомумән, индустриаль системалар дистәләгән миллион парга тәрҗемә модельләре буенча күнегүләр үткәрә, безнең очракта әлегә бер миллионны гына җыя алдык. Шуңа күрә, күчерү сыйфатын яхшырту өчен, иң беренче чиратта, мәгълүматларны җыю юнәлешендә эшләргә кирәк. Гамәли семиотика институты моны эшли алыр дип өметләнәм. Минем аны тагын да яхшырак итәргә ярдәм итәсем килә, әмма моның өчен, барыннан да элек, яңа мәгълүматлар кирәк. Хәзер тәрҗемә сыйфатын яхшырту өчен башка төрки телләрдәге мәгълүматларны куллану идеясе өстендә эшлибез».

Интернеттан.
(Гөлнур В
ӘЛИЕВА тәрҗемәсе).

Качественная укладка линолеума или как сделать правильно прикатку линолиума