Имена собственные. Русско-английская транслитерация.Михаил Талантов, «КомпьютерПресс», №101999 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Практика показывает, что большинство деловых поисковых задач в Интернете в той или иной степени связано с поиском имен собственных названия компаний и организаций, всевозможных стандартов, оборудования и т.п. Любимые стихи и биографию эстрадной звезды также проще отыскать по личным именам. Во многих поисковых ситуациях, которые, казалось бы, не имеют прямого отношения к именам собственным, привлечение последних обеспечивает наибольшую результативность. Например, если вы решили разыскать в Сети фотодокументы, имеющие отношение к кометам, в частности к космической тематике в целом, то применение термина NASA (аббвеатура Американского Национального Управления по Аэронавтике) как одного из элементов запроса не только облегчит вашу задачу, но и даст некоторые гарантии достоверности информации. Многие наименования имеют национальное происхождение и появляются в тексте документа в оригинальном написании с использованием символов соответствующих алфавитов: немецкого, французского, японского и др. Если такое имя попадает в URL ресурса, то разработчик вынужден прописать его средствами латинской графики. Сама по себе проблема транслитерации, то есть точной передачи текста одного языка средствами алфавита другого языка, не нова. Трудно добиться однозначности такого перевода в прямом и обратном направлении без разработки жестких стандартов. В мире хорошо известны ИСО (www.iso.ch) стандарты по транслитерации языков всех континентов из одной графики в другую, которыми широко пользуются в алфавитных каталогах иностранной литературы. Однако имена в Интернете присваивают не специалисты библиотечного дела. Это приводит к стихийному размыванию стандартов и появлению реальных проблем при поиске. Если говорить о русских наименованиях в Сети присутствующих в URL ресурсов, то наблюдаются заметные отклонения от стандартов Таблица. Обобщенная система
Особое внимание читателя обращаем на то, что наиболее вероятные варианты транслитерации приведены для каждой буквы или сочетания в числе первых, после чего следует менее употребительные. Здесь было бы уместно обсудить несколько важных моментов, которые не слишком внятно отражены в таблице. Многозначность транслитерации при отсутствии признанного стандарта неизбежна. Так, русская буква в заменяется, как правило как v (www.vladivostok.com от г.Владивосток), тогда как w встречается гораздо реже (www.rdw.ru от названия газеты «Работа для вас»). Отдельно следует отметить случай употребления русских наименований, звучание или транслитерация которых близки или совпадают с англоязычным эквивалентом. Они создают некоторые проблемы при поиске узла. Например, русскоязычный сервер Кавказкие Минеральные Воды, казалось должен иметь имя www.kmv.ru, однако реальный адрес другой www.cmw.ru от англ. Caucasian Mineral Water, аналогично для сервера Очевидно, что таблицу транслитерации, ориентированную на реальные поисковые задачи, следует расширить не только в соответствиями в v,w; к k,c; но и рядом других (см.табл.). Тем не менее не все возможные варианты оказались учтены, поскольку нет смысла еще больше размывать систему транслитерации случаями, связанными с чисто английскими языковыми особенностями. Если вам, скажем, понадобилась компания, известная под именем Мун, то имя узла www.mun.com вполне может оказаться неверным, если первоисточник подразумевал английское Moon (луна) со своим специфическим написанием. Варианты типа у oo не включались в таблицу. В подобных ситуациях, требующих хорошего знания иностранного языка как такового и его звукографических соответствий, целесообразно прибегать к так называемым словарям плохого произношения. В них обычно приводится все многообразие графических вариантов проблемно звучащей лексики. На сегодня можно считать почти состоявшейся замену ранее активно используемой «пронемецкой» литеры j для передачи русских гласных (у ju, е jo, я ja, и реже е je) на «более английский» вариант литеру у (yu, yo, ya, реже ye). Русская буква е обычно заменяется латинской e, особенно после гласных (www.perm.ru от г.Пермь). После гласной встречается как литера e (www.krylatskoe.msk.ru от Крылатское), так и сочетание ye (Krylatskoye). Букву й в середине слова чаще заменяет литера i (Doinov фамилия Дойнов, далее сокращенная форма), а в конце слов после гласной y (Rushchay фамилия Рущай). Сочетания ий и ый на конце слов чаще передаются единственной буквой y (www.primorsky.ru от Приморский край), но есть и другие варианты (www.mari.su от республики Марий Эл). Для буквы я применяется также несколько способов ее передачи: ya обычно появляется после согласной или в начале слова (www.bryansk.ru от г.Брянск; www.yaroslavl.su от г.Ярославль, но и www.krasnoyarsk.ru от г.Красноярск), a чаще встречается после гласной, особенно после i на конце слов (www.karelia.ru от республики Карелия). Что касается мягкого и твердого знаков, то URL они обычно никак не передаются (www.citynet.kharkov.ua от г.Харьков), хотя в поле текста Web-страницы можно столкнуться с использованием апострофа (Solovev фамилия Соловьев). Наконец, русская ы наиболее часто передается с помощью y (www.syzran.ru от г.Сызрань), i используется для этого гораздо реже. |
Источник: akmac.narod.ru/st/st9.htm