АКМА. Каталог веб-разработчика. 
Поиск на сайте
 
Искать на:  Яndex   Rambler   Апорт   Google
ГлавнаяСтатьиСсылкиJavaScriptПоиск
СтатьиПоисковые машиныМетапоискКаталоги

Имена собственные. Русско-английская транслитерация.

Михаил Талантов, «КомпьютерПресс», №10’1999

 версия для печати
 

Практика показывает, что большинство деловых поисковых задач в Интернете в той или иной степени связано с поиском имен собственных — названия компаний и организаций, всевозможных стандартов, оборудования и т.п. Любимые стихи и биографию эстрадной звезды также проще отыскать по личным именам. Во многих поисковых ситуациях, которые, казалось бы, не имеют прямого отношения к именам собственным, привлечение последних обеспечивает наибольшую результативность. Например, если вы решили разыскать в Сети фотодокументы, имеющие отношение к кометам, в частности к космической тематике в целом, то применение термина NASA (аббвеатура Американского Национального Управления по Аэронавтике) как одного из элементов запроса не только облегчит вашу задачу, но и даст некоторые гарантии достоверности информации.

Многие наименования имеют национальное происхождение и появляются в тексте документа в оригинальном написании — с использованием символов соответствующих алфавитов: немецкого, французского, японского и др. Если такое имя попадает в URL ресурса, то разработчик вынужден прописать его средствами латинской графики. Сама по себе проблема транслитерации, то есть точной передачи текста одного языка средствами алфавита другого языка, не нова. Трудно добиться однозначности такого перевода в прямом и обратном направлении без разработки жестких стандартов. В мире хорошо известны ИСО (www.iso.ch) — стандарты по транслитерации языков всех континентов из одной графики в другую, которыми широко пользуются в алфавитных каталогах иностранной литературы. Однако имена в Интернете присваивают не специалисты библиотечного дела. Это приводит к стихийному размыванию стандартов и появлению реальных проблем при поиске.

Если говорить о русских наименованиях в Сети присутствующих в URL ресурсов, то наблюдаются заметные отклонения от стандартов ISO-9-1986-(E)/ISO/TC 46 по транслитерации знаков славянской кириллицы знаками латинского алфавита. Существование нескольких русских кодировок типа translit для обмена почтовыми сообщениями, англоязычное происхождение самого Интернета, а также доминирование в образовательной системе России английского языка над другими определяют тенденции подобных отклонений. В таблице мы приводим обобщенную русско-латинскую систему транслитерации, фактически тяготеющую к русско-английской. Она составлена на основе анализа большого количества имен российской части Интернета и нескольких распространненых в Сети схем транслитерации.

Таблица. Обобщенная система русско-латинской транслитерации, ориентированная на решение поисковых задач:

Буква или сочитание (рус.)Варианты транслитерации (лат.)
аa
бb
вv, w
гg, h, gu
гвgv, gw, gu
гзgz, x
дd
джdzh, j, g
еe, ye,je,ie
еe, yo, io, ye, ie, jo, je
жzh, g, j
зz, s
иi, y
ияia, iya, ija
йy, i
ий, ый на конце словy, iy, i, ii
кk, c, ch
ксks, x
квkv, kw, qu
лl, ll
мm
нn
оo
пp, pp
рr, rr
сs, c, ss
тt, th
уu
фf, ph
хkh, h
цts, tz
чch
шsh, ch
щshch
ьопускается, " ' "
ъопускается, " ' "
ыy, i
эe
юyu, u, ju, iu
яya, ia, a

Особое внимание читателя обращаем на то, что наиболее вероятные варианты транслитерации приведены для каждой буквы или сочетания в числе первых, после чего следует менее употребительные. Здесь было бы уместно обсудить несколько важных моментов, которые не слишком внятно отражены в таблице. Многозначность транслитерации при отсутствии признанного стандарта неизбежна. Так, русская буква в заменяется, как правило как v (www.vladivostok.com от — г.Владивосток), тогда как w встречается гораздо реже (www.rdw.ru — от названия газеты «Работа для вас»).

Отдельно следует отметить случай употребления русских наименований, звучание или транслитерация которых близки или совпадают с англоязычным эквивалентом. Они создают некоторые проблемы при поиске узла. Например, русскоязычный сервер Кавказкие Минеральные Воды, казалось должен иметь имя www.kmv.ru, однако реальный адрес другой — www.cmw.ru — от англ. Caucasian Mineral Water, аналогично для сервера Альфа-Капитал — www.acapital.ru — от англ. capital, а не от русск. kapital.

Очевидно, что таблицу транслитерации, ориентированную на реальные поисковые задачи, следует расширить не только в соответствиями — в — v,w; к — k,c; но и рядом других (см.табл.).

Тем не менее не все возможные варианты оказались учтены, поскольку нет смысла еще больше размывать систему транслитерации случаями, связанными с чисто английскими языковыми особенностями. Если вам, скажем, понадобилась компания, известная под именем Мун, то имя узла www.mun.com вполне может оказаться неверным, если первоисточник подразумевал английское Moon (луна) со своим специфическим написанием. Варианты типа у — oo не включались в таблицу. В подобных ситуациях, требующих хорошего знания иностранного языка как такового и его звукографических соответствий, целесообразно прибегать к так называемым словарям плохого произношения.

В них обычно приводится все многообразие графических вариантов проблемно звучащей лексики.

На сегодня можно считать почти состоявшейся замену ранее активно используемой «пронемецкой» литеры j для передачи русских гласных (у — ju, е — jo, я — ja, и реже е — je) на «более английский» вариант — литеру у (yu, yo, ya, реже ye).

Русская буква е обычно заменяется латинской e, особенно после гласных (www.perm.ru — от г.Пермь). После гласной встречается как литера e (www.krylatskoe.msk.ru — от Крылатское), так и сочетание ye (Krylatskoye).

Букву й в середине слова чаще заменяет литера i (Doinov — фамилия Дойнов, далее сокращенная форма), а в конце слов после гласной — y (Rushchay — фамилия Рущай). Сочетания — ий и ый на конце слов чаще передаются единственной буквой y (www.primorsky.ru — от Приморский край), но есть и другие варианты (www.mari.su — от республики Марий Эл). Для буквы я применяется также несколько способов ее передачи: ya — обычно появляется после согласной или в начале слова (www.bryansk.ru — от г.Брянск; www.yaroslavl.su — от г.Ярославль, но и www.krasnoyarsk.ru — от г.Красноярск), a чаще встречается после гласной, особенно после i на конце слов (www.karelia.ru — от республики Карелия).

Что касается мягкого и твердого знаков, то URL они обычно никак не передаются (www.citynet.kharkov.ua — от г.Харьков), хотя в поле текста Web-страницы можно столкнуться с использованием апострофа (Solov’ev — фамилия Соловьев). Наконец, русская ы наиболее часто передается с помощью y (www.syzran.ru — от г.Сызрань), i используется для этого гораздо реже.

 

ГлавнаяСтатьиСсылкиJavaScriptПоиск
Новости  |  Карта сайта
Редакция от: 
Copyright ©1999—2003 «Art&Fact»ВверхE-mail: artefact@udm.net
Hosted by uCoz