Дебютът на нов модел на изкуствен интелект на тибетски език се очаква да разшири цифровия достъп и обществените услуги в тибетоговорящите региони, предлагайки подобрена подкрепа за сектори, вариращи от здравеопазване и образование до управление и опазване на културата.

Представен в Пекин в сряда, моделът – наречен Zeta – е разработен от Държавната ключова лаборатория за тибетско разузнаване в Кингхайския нормален университет. Той е подаден съгласно националните разпоредби за генеративни AI услуги и влезе в публично тестване и пилотно приложение, превръщайки се в първия широкомащабен модел на Qinghai, предназначен за пълна мултимодална обработка на тибетския език.

Дорла, изпълнителен заместник-директор на лабораторията, каза, че регулаторната документация бележи нова отправна точка за прилагане на технологията към нуждите на реалния свят. За разлика от традиционните AI системи, обикновено предназначени за превод на текст или разпознаване на реч, Zeta използва цялостен, многоизмерен подход към езиковата обработка.

„Неговите разширени възможности обхващат слушане, говорене, четене, писане и превод на трите основни тибетски диалекта – Amdo, U-Tsang и Kham“, каза Dorlha.

Системата включва иновации като разпознаване на смесени езици на документи, производство на аудиокниги, извличане на древна литература и интелигентно транскрибиране на субтитри, наред с други, каза той.

В допълнение, специфичните за индустрията функции като цифрово излъчване и транскрипция на субтитри го правят ценен инструмент за сектори, вариращи от медии до селско стопанство и туризъм.

Технологично Zeta интегрира тибетски, стандартен китайски и английски в многоезична рамка. Поддържа се от обширен набор от данни, включващ 150-гигабайтов висококачествен тибетски текстов корпус, 87 милиона многоезични паралелни изречения и 30 000 часа аудиозаписи на много диалекти.

В съчетание със самостоятелно разработени алгоритми и съвместимост с местната AI инфраструктура, моделът демонстрира техническа зрялост и мащабируемост, каза Дорла.

С версии, налични в 7 милиарда, 50 милиарда и 122 милиарда параметри, Zeta е проектирана да се справи с редица предизвикателства, включително езиков превод, гласово разпознаване, медицинска помощ и съхранение на литература.

Nyima Tashi, професор в университета Xizang и директор на Държавната ключова лаборатория за тибетско разузнаване, каза, че стартирането на Zeta и нейните продукти за приложение ще допринесе за висококачествено икономическо и социално развитие в тибетските региони на Китай.

„Лабораторията ще продължи да задълбочава изследванията на AI на тибетски език, да увеличава научните инвестиции, да укрепва развитието на таланти и да подобрява сътрудничеството между индустрията, академичните среди и изследователските институции“, каза той.

Продължавайки напред, екипът има за цел да усъвършенства модела чрез внедряване на мултимодални възможности чрез отворени интерфейси за програмиране на приложения и насърчаване на сътрудничество между академични институции и частни предприятия, изграждайки по-широка екосистема за AI на тибетски език.

Пускането на Zeta идва около месец след пускането на Deep-Zang, първият тибетски голям езиков модел, пуснат в автономния регион Xizang, предлагащ повече опции за потребителите.

Тензин Палден, тибетски студент в селскостопанския университет в Шандонг, каза, че Zeta предлага надежда за запазване на неговата езикова идентичност в един все по-дигитален свят.

„Чрез справяне с исторически предизвикателства като ограничен набор от данни и разнообразие в тибетските диалекти, тази иновация осигурява така необходимата инерция за свързване на мъдростта на тибетските традиции със съвременното развитие“, каза той.

„Това не е само технологично постижение, но и отражение на защитата и предаването на етническата култура.

Свържете се с авторите на [email protected]

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin