facebook
twitter
vk
instagram
linkedin
google+
tumblr
akademia
youtube
skype
mendeley
Wiki
Global international scientific
analytical project
GISAP
GISAP logotip

ТЕХНОЛОГИИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ В ДОМЕННОМ НЕЙМИНГЕ

Автор Доклада: 
Концевая Г.М., Концевой М.П.
Награда: 
ТЕХНОЛОГИИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ В ДОМЕННОМ НЕЙМИНГЕ

УДК 81'322:004.9 004.4:81'32

ТЕХНОЛОГИИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ В ДОМЕННОМ НЕЙМИНГЕ

Концевая Галина Михайловна, канд. филол. наук, доцент
Концевой Михаил Петрович, науч. сотрудник
Брестский государственный университет


В докладе рассматриваются компьютерные технологии анализа слова в интернет-нейминге. Обозначаются проблемы фоносемантического и лексикографического анализа. Предлагаются подходы к их разрешению.
Ключевые слова: домен, нейминг, фоносемантика, словарь, лингвистика, лексикография, технология, разметка.

In the report computer technologies of the analysis of a word in the Internet-naming are examined. Problems of the phonosemantic and lexicographic analysis are designated. Approaches to their permission are offered.
Keywords: domain, naming, phonosemantics, dictionary, context, linguistics, lexicography, technology, and markup

Современная филология все более широко использует математический инструментарий и компьютерные технологии в контексте перехода от описательных к аналитическим методам исследований. Если для традиционных областей филологического исследования компьютерные технологии лингвистического анализа открывают новые возможности и перспективы, то в тех областях функционирования языка, которые созданы в результате информатизации общества на основе использования компьютерных средств и систем, эффективный результативный филологический анализ уже невозможен без опоры на вычислительную лингвистику и численные методы.
Одной из таких областей является пространство доменных имен (системная иерархическая совокупность символьных имен, служащая для идентификации информационных администрантивных автономных ресурсов в Интернете) [1].
Интерес филологической науки к проблематике доменной номинации первоначально был обусловлен правовыми коллизиями в отношении доменных имен, которые потребовали лингвистической экспертизы со стороны онимологов. С лингвистической точки зрения доменные имена являются именами собственными, обладают свойством системности и составляют ономастическое поле. Но определить положение доменных имен в ономастическом пространстве и их место на различных классификационных номинативных шкалах оказалось достаточно сложно. То, к какой области ономастического пространства они должны быть отнесены, остается комплексной проблемой, решение которой видится на путях выявления связей между ее лингвистическими, информационно-технологическими, экономическими и правовыми аспектами и контекстами [2]. Для самой лингвистической науки это открывает новые перспективы интеграции с инновационными решениями в названных областях, обусловленных, в свою очередь, использованием современных компьютерных технологий.
Вместе с тем, правовые вопросы являются только одним из множества аспектов освоения филологической наукой новообразуемого лексического пространства, которое уже сейчас впечатляет своими масштабами.
Так, по состоянию на 10.09.2011 в национальной доменной зоне Украины (.UA) было зарегистрировано шестисоттысячное доменное имя [3]. По итогам августа 2011 года в российском национальном домене верхнего уровня (.RU) зарегистрировано 3412266 доменных имен. Впереди российского домена национальные домены Германии (.DE) – 14572913 доменных имен, Великобритании (.UK) – 9627873 доменных имени и Нидерландов (.NL) – 4641578 доменных имени. Национальный домен Китая (.CN) по итогам августа 2011 года в домене насчитывал 3345906 доменных имен. Впечатляет рост новых лексических единиц в пространстве доменных имен, особенно в русскоязычном сегменте Интернета. Так, прирост доменных имен в домене .RU за последний год составил почти 15%. По итогам августа 2011 года количество доменных имен в .RU выросло на 1,3%, или на 43846 доменных имен. Для сравнения: в домене .DE прирост составил 0,2%, или 29174 доменных имени, а ближайший конкурент – домен .EU, в котором 3394024 доменных имени – вырос на 0,64%, или на 21626 [4].
Компания Verisign (крупнейший мировой DNS-оператор, поддерживающий домены первого уровня .COM, .NET) опубликовала отчет [5], согласно которому во II квартале 2011 года прирост количества доменных имен в Интернете составил 2,5% в сравнении с I кварталом (5,2 млн. новых доменных имен). Таким образом, к концу II квартала 2011 года во всех доменных зонах интернета насчитывалось 215 млн. доменных имен. За минувший год общая база зарегистрированных доменов выросла на 8,6%, или на 16,9 млн. доменов. В национальных географических доменных зонах работают 84,6 млн. доменов, что на 2,9%, или 6,6 млн. доменов, больше, чем по итогам первого квартала. Самый большой прирост количества регистраций отмечен в национальных доменах Бразилии, Австралии и Испании. В квартальном исчислении рост составил более 4% по каждой из них.
В настоящее время активно внедряются доменные имена на национальных языках. Так, второй российский национальный домен (вновь образованная кириллическая зона .РФ) продемонстрировал за август 2011 года рост на 1,8% (15371 доменное имя за месяц). Всего в домене .РФ по итогам августа было зарегистрировано 886239 доменных имен. А начавшийся переход на протокол IPv6 расширяет потенциальное лексическое пространство доменной номинации практически до бесконечности.
Для филолога важно, что этот новый громадный массив имен представляет собой современную активную лексику. Он не просто создан и где-то хранится в машинных фондах вне человеческого внимания, за пределами современной коммуникативной среды, но и активно используется людьми, прочитывается ими, осознается, активирует их деятельность. Так, согласно отчету Verisign 88% имен в доменных зонах .COM и .NET интенсивно используются и ведут на тот или иной сайт, находящийся в активном состоянии. Средняя суточная нагрузка на доменную систему во втором квартале составила 58 миллиардов запросов на разрешение доменов по всему миру. Пиковое квартальное значение составило 68 миллиардов запросов [5].
Актуальность пространства доменных имен для современной лингвистики определяется не только тем, что оно требует описания и анализа в качестве предмета исследования, но и тем, что это пространство активно и сознательно конструируется людьми в контексте решения вполне конкретных и насущных проблем. Основными приемами создания доменных имен являются заимствование названия ресурса (сайта), усечение названия, гипонимия названия, заимствование темы ресурса, обыгрывание омонимии, аббревиация, дезаббревиация, использование доменных зон как частей названия, траслитерация и др. [6].
Доменная номинация может быть рассмотрена в контексте нейминга (от англ. «to name» – давать имя) – технологии создания успешных названий для компаний, товаров или услуг, подчиненных задачам позиционирования в целевой аудитории. Цель нейминга − создание уникального имени, несущего в себе общую концепцию продукта или компании, имеющего положительную эмоциональную связь с целевым рынком, являющегося прочным фундаментом для создания таких символов бренда, как логотип, слоган и легенда.
Сегодня нейминг − одна из самых востребованных маркетинговых услуг, которая нуждается в эффективном лингвистическом обеспечении. Актуальность и сложность современного нейминга стремительно увеличивается в связи с возросшей динамикой бизнес-среды и ростом насыщенности рынка, усилением конкуренции и возрастанием значимости нематериальных компонентов товаров и услуг, в первую очередь их наименований. Так, успешная доменная номинация является важнейшим компонентом для линкбейтинга (linkbaiting) – одного из современных методов получения обратных ссылок на сайт или блог с других интернет-ресурсов, когда владельцы различных сайтов сознательно ссылаются на Ваш сайт как на источник полезной информации.
Особенности доменного нейминга определяются глобальностью среды функционирования имени, мультикультурной и многоязычной. Доменный нейминг предполает обязательную проверку на глобальную совместимость имени, работу с качественно новым инструментарием создания, освоения, представления и культивирования имен в качестве глобальных идентификаторов.
Эффективный доменный нейминг опирается не только на опыт, интуицию, творчество и специальные знания в области языка, психологии, рекламы. Для определения стратегии поиска подходящего в каждой конкретной ситуации имени он должен опираться на информационные технологии. Даже простейший статистический анализ позволяет определить важнейшие параметры для доменного нейминга. Так, согласно статистическим данным аналитической интернет-компании Flippa о стоимости и популярности зарегистрированных доменных имен (август 2011 г.) ценность доменного имени резко снижается, если оно длиннее 10 знаков, доказательством чему служит продажа домена, а использование пунктуационного знака тире в доменном имени снижает его ценность на 26% [7].
Среди лингвистических критериев успешности имени сетевого ресурса можно выделить: фонетический (слово должно сравнительно легко произноситься, соответствовать звуковому строю конкретных языков); психолингвистический (вызываемые звучанием слова неосознаваемые описательные ассоциации); лексикографический (для обеспечения стабильности зрительного восприятия бренда имя бренда в идеале должно транслитерироваться одинаковым количеством знаков в независимости от используемого алфавита); денотативный (указание на множество предметов, которые обозначаются данным именем); коннотативный (для указания на качества, отличительные свойства, действия обозначаемых именем предметов); ассоциативный (для актуализации содержательных ассоциаций, вызываемых данным словом безотносительно к его референту); смысловой (для симуляции именем индикатора принадлежности к желаемой общности).
Сегодня тщательно структурированная и качественно защищенная в глобальной сети торговая марка, если она дополнена одноименным доменом в зоне .COM, имеет второе по важности значение после самого продукта.
Эмпирически можно определить правила подбора имени, в соответствии с которыми оно должно: быть оптимизировано по краткости и значению; отличаться уникальностью или своеобразием; указывать на качество продукта (в действительности качество может быть симуляционно номинативное); характеризоваться связанностью с реальностью (тотально семиотизированной); выделяться коммуникативной процессуальностью (симулировать персонифицированную направленность и чувство общности, формировать дружественное отношение); легко запоминаться; легко произноситься и легко восприниматься; быть приятно для глаз и для ушей (имя товара в миллионы раз чаще произносится, чем читается, значит, оно должно быть приятным на слух, не вызывать негативных ассоциаций).
Сказанное выше хорошо иллюстрирует первостепенную важность фоносемантического анализа и соответствующей оценки имени в процессе нейминга. Предметом фоносемантики является звукосимволическая система языка, единицы которой обладают необходимой, существенной, повторяющейся и относительно устойчивой непроизвольностью, фонетически мотивированной связью между фонемами слова и денотатом, т.е. «фоносемантика изучает примарную мотивированность языковых единиц и текстов» [8, с. 17].
Изучение фоносемантической структуры художественного текста фактически было начато первыми работами А.П. Журавлева [9]. Открытие универсальных фоносемантических закономерностей текста сразу же потребовало формализации и автоматизации методов анализа на основе использования компьютерных лингвистических технологий. Формализованные методы изучения текста частично реализованы в прикладных компьютерных программах фоносемантического анализа (Vaal, Diaton, Psyline CD и др.).
В основе каждой из программ лежит предложенный Ч. Осгудом метод семантического дифференциала. В экспериментальном исследовании фоносемантических характеристик языка после набора статистически значимых оценок для каждого звука и серии дополнительных экспериментов используется формула расчета фонетического значения слова в соответствии со шкалами семантического дифференциала:
,
где F – фонетическая значимость слова; fi – фонетическая значимость очередного звука слова; ki – коэффициент для очередного звука. Под фонетической значимостью подразумевается оценка звука по заданной шкале семантического дифференциала, полученная в результате опроса. Коэффициент, учитывающий разницу частотностей звуков слова (ki), можно вычислить как отношение:
,
где Pi – частотность для каждого звука, Pmax – максимальная частотность звука в данном слове. Для первого звука в слове коэффициент k дополнительно умножается на 4, а для ударного звука – на 2. Чтобы рассчитать оценку фонетической значимости, слово нужно перевести в звукобуквы.
Журавлёв А.П. предложил оценки звуков по 25 шкалам семантического дифференциала и вычисляемые коэффициенты частотности звуков в конкретном языке [9]. Сегодня очевидно, что такой подход позволяет получить достоверный результат только для очень локальных областей коммуникативных практик и не может быть использован в интернет-нейминге.
Для повышения адекватности фоносемантического анализа на основе современных достижений информационных технологий и компьютерной лексикографии разработаны более мощные процедуры количественно-статистической обработки субъективных оценок. Например, многомерное шкалирование (multi-dimensional scaling – MDS), позволяющее учитывать одновременно множество параметров многих стимулов восприятия слова в реальном коммуникативном контексте.
Современные языковые корпуса на основе технологий гипертекстовой разметки предполагают возможность (практически реализованную в различной степени) автоматической генерации многомерного лексикографического описания слова с заданной полнотой. Для адекватной фоносемантической оценки вокабулы словарная статья должна включать: группу слов с близким значением; cовпадающую часть значения; близкие слова и группы слов (в порядке убывания значимости и категоричности оппозиций); доминанту группы (наиболее употребительное слово группы, которым можно заменить остальные слова во всех контекстах, где не подчеркиваются различия между соответствующими предметами); различительные признаки, релевантные для данной группы (перечисленные от более общих к более частным); смысловые различия; другие значения слов, входящих в группу; другие редкие слова, примыкающие к группе; региональные варианты; данные нормативных документов; этимологию и время появления слова; иллюстрации: тексты и изображения.
Вместе с тем надо понимать относительность вероятностных и статистических результатов работы программ фоносемантического анализа. Устранимые погрешности могут быть обусловлены ошибками алгоритмов либо их программной реализации. Неустранимые на сегодняшний день погрешности имеют фундаментальные языковые причины. Среди них: быстрые изменения значений слов и самих реалий, размытость, диффузность значений в этой сфере, различия региональных вариантов, семейных лексиконов, словоупотребления людей разных поколений, предпочтения отдельных идиолектов, интерференция общего и профессионального словоупотребления, возможность употребления в упрощенном режиме, когда слово может использоваться в гиперонимическом смысле.
В связи с развитием сетевых сообществ, которые играют все более значимую роль как в части формирования статуса членов общества, так и, например, в определении их предпочтений и потребностей, актуальным является конструирование имен для многоязычных аудиторий, сами фоносемантические предпочтения которых стремительно эволюционируют. Это не позволяет полагаться на выверенные для конкретных языков шкалы, а требует регулярного шкалирования и анализа для каждого конкретного случая.

Литература:
1. Концевая, Г.М. Система доменной номинации в Интернете / Г.М. Концевая, М.П. Концевой // Актуальные вопросы славянской ономастики. – Гомель : ГГУ им. Ф. Скорины, 2006. – С. 112–120.
2. Концевой М.П. Концевая Г.М. Доменная номинация и трансфер: проблемы правового статуса и регулирования // Материалы II-ой международной научно-практической конференции "Современные тенденции развития научной мысли" (31.01.2011 – 07.02.2011) – Киев, Украина. [Электронный ресурс] Режим доступа: www.icp-ua.com/ru/domennaya-nominatsiya-i-transfer-problemy-pravovogo-st.... Дата доступа 11.09.2011.
3. 600000 доменов в .UA [Электронный ресурс] Режим доступа: http://zezya.com / Дата доступа 11.09.2011.
4. Домены предпочитают иностранных хостеров. [Электронный ресурс] Режим доступа: http://www.comnews.ru/index.cfm?id=63590 Дата доступа 07.09.2011.
5. Verisign [Электронный ресурс] Режим доступа: http://www.verisign.com/ Дата доступа 09.09.2011.
6. Куприенко, М.С. Лингвостилистический анализ приемов создания доменных имен Рунета // Гипертекст как объект лингвистического исследования. – Самара : ПГСГА, 2010. – С. 80–83.
7. State of the Website Economy: Focus on Website Domains [Электронный ресурс] Режим доступа: http://flippa.com/blog/state-of-the-website-economy-focus-on-website-dom... Дата доступа 09.09.2011.
8. Воронин, С.А. Основы фоносемантики / С.А. Воронин. – СПб., 2006. – 248 с.
9. Журавлев, А.П. Звук и смысл / А.П. Журавлев. – М. : Просвещение, 1991. – 160 с.

7.71429
Ваша оценка: Нет Средняя: 7.7 (7 голосов)

ТЕХНОЛОГИИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ В ДОМЕННОМ НЕЙМИНГЕ"

Статья выполнена в ономасиологическом аспекте на стыке технологии и гуманитарной науки. Компьютерная лингвистика, прикладная лингвистика рассматриваются как актуальные направления науки. Рецензируемая статья решает актуальные задачи современной теории номинации, обращая внимание на процесс создания онимов. Исследование нейминга опирается на основные способы и типы номинации, чётко представленные в статье, которая продолжает ряд новых исследований, посвящённых ономам Интернет-пространства (например, никнеймов). В рамках одой статьи предложены 4 самостоятельные проблемы, которые выходят за рамки ономасиологии, выводят на уровень семантики вообще, семасиологи – в частности. К тому же включён материал по фоносемантике, которая до сих пор является не бесспорной. Например, сочетание звуков в фамилии эксперта по тест-методике А.Журавлёва имеет больше положительных коннотаций, тогда как семантика производного слова – в большей степени отрицательная. Обращают ли авторы статьи внимание на данный феномен? Проводится ли сопоставление фоносемантики и лексической семантики исследуемых ономов? Каким образом значение лексемы зависит от семантики звукокомплекса, составляющего единицу исследования? Рецензируемая статья соответствует критериям новизны и актуальности. Однако отсутствие примеров в тексте статьи не даёт возможности в полной мере оценить исследованный языковой фактический материал. Хотя проблемы правомочности и актуальны (невозможность приводить названия, например, сайтов, не рекламируя их) , однако некоторый фактический материал усилил бы общее положительное впечатление от статьи, тем более, что рассматриваются единицы исскуственной номинации.

Уважаемая Елена Анатольевна,

Уважаемая Елена Анатольевна, спасибо за содержательный комментарий. Действительно, статья выполнена "на стыке технологии и гуманитарной науки" и призвана к научной проблематизации опыта практического использования компьютерных технологий в лингвистике, а не к демонстрации готовых концепций и решений. В настоящее время отсутствует адекватная теоретическая модель бесспорных фоносемантических закономерностей, которые, вместе с тем, удается эффективно использовать для решения конкретных практических задач. В основе "спорности" фоносемантического анализа, как правило, лежат выводы, полученные на основе некорректной практики применения программы Vaal-mini, которая предназначена исключительно для демонстрационных учебных целей и не может использоваться в качестве научного инструментария. Корректные примеры фоносемантического анализа громоздки из-за многомерности шкалирования и необходимости учета разноплановых коннотаций, которые необходимо указывать для правильной интерпретации во избежание спекуляций. Именно это обстоятельство заставило пожертвовать примерами в статье, что, конечно же, не является ее достоинством.
Партнеры
 
 
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
image
Would you like to know all the news about GISAP project and be up to date of all news from GISAP? Register for free news right now and you will be receiving them on your e-mail right away as soon as they are published on GISAP portal.