Как сделать вектор в word?

Тема урока: «Создание векторного рисунка в Microsoft Word».

Добавляйте авторские материалы и получите призы от Инфоурок

Еженедельный призовой фонд 100 000 Р

Тема: «Создание векторного рисунка в Microsoft Word».

помочь учащимся получить представление об офисном пакете Microsoft Office, познакомиться с возможностями программы Word, научить создавать векторные рисунки в Word.

воспитание информационной культуры учащихся, внимательности, аккуратности, дисциплинированности, усидчивости.

развитие познавательных интересов, навыков работы на компьютере, самоконтроля, умения конспектировать.

доска, компьютер, компьютерная презентация.

Орг. момент. (1 мин)

Актуализация знаний. (5 мин)

Теоретическая часть. (10 мин)

Практическая часть. (15 мин)

Вопросы учеников. (5 мин)

Итог урока. (2 мин)

Приветствие, проверка присутствующих. Объяснение хода урока.

II. Актуализация знаний.

Наряду с тем, что редактор Word позволяет вставлять в текстовый документ не текстовые элементы или объекты – рисунки, диаграммы, формулы, он обладает собственными инструментами для создания и редактирования графических объектов.

Давайте вспомним какие виды компьютерных изображений вы знаете. (растровые и векторные)…

На этом уроке мы научимся создавать векторные рисунки в Word.

III. Теоретическая часть.

Для создания собственных изображений в документах Word используется панель инструментов Рисование, с помощью которой вы можете нарисовать и оформить простейшие графические объекты: прямоугольник, овал, линию или фигуры произвольной формы. Чтобы отобразить панель Рисование вызовите команду Вид→Панель инструментов→Рисование.

Панель инструментов Рисование содержит три группы кнопок, которые служат для вставки изображений, а также для изменения параметров форматирования существующих объектов.

При работе с объектом можно пользоваться всеми доступными инструментами рисования. Чтобы нарисовать соответствующий объект, необходимо щелкнуть на соответствующей кнопке этой панели инструментов и перемещать указатель при нажатой кнопке мыши. По завершении рисования щелкните кнопкой мыши в любом месте за пределами объекта.

Чтобы создать несколько объектов одним и тем же инструментом, выполните двойной щелчок на кнопке этого инструмента. Он будет активен до тех пор, пока вы не нажмете кнопку другого инструмента, не начнете вводить текст или не выполните любое другое действие, отличное от перемещения указателя при нажатой кнопке мыши.

Если в процессе рисования вы будете удерживать нажатой клавишу [Shift], зафиксируется определенная форма объекта. Например, овал превратится в окружность, а прямоугольник в квадрат. Если же держать нажатой клавишу [Shift] во время проведения линии, то линия будет вертикальной, горизонтальной или пройдет под углом 30, 45 либо 60 0 . Чтобы нарисовать прямоугольник или овал, начиная от центра фигуры, перемещайте мышь при нажатой клавише [Ctrl].

Для того чтобы нарисовать линию или стрелку, щелкните на кнопке Линия или Стрелка. Указатель примет вид крестика. Щелкните на предполагаемой начальной позиции линии или стрелки и, удерживая нажатой левую кнопку мыши, переместите указатель мыши к предполагаемой конечной позиции линии или стрелки. Отпустите кнопу мыши – линия будет начерчена, а инструмент рисования станет неактивным. При рисовании стрелки наконечник появляется с той стороны, где была отпущена кнопка мыши.

При использовании кнопок Прямоугольник или Овал перетащите указатель мыши от одного угла объекта к другому, а затем отпустите кнопку мыши.

Может оказаться, что для реализации ваших планов перечисленных графических объектов недостаточно. В этом случае воспользуйтесь богатой коллекцией готовых геометрических фигур, доступ к которым вы можете получить, щелкнув на кнопке Автофигуры панели инструментов Рисование.

Автофигуры объединены в восемь категорий: Линии, Соединительные линии, Основные фигуры, Фигурные стрелки, Блок-схема, Звезды и ленты, Выноски и Другие автофигуры. Выбрав нужную категорию, откройте меню автофигур и щелкните по кнопке автофигуры.

Если поверх обычного текста или графического объекта необходимо расположить какой-либо текст, поместите его в специальное текстовое поле, которое можно создать посредством кнопки Надпись. С помощью панели инструментов Форматирования этот текст можно форматировать.

Для вставки текста в автофигуру:

Выполните одно из следующих действий.

a. Для добавления текста щелкните правой кнопкой мыши любую фигуру (кроме прямых линий и полилиний), в контекстном меню выберите команду Добавить текст, а затем введите нужный текст.

b. Для изменения или дополнения существующего текста щелкните правой кнопкой мыши любую фигуру (кроме прямых линий и полилиний), в контекстном меню выберите команду Изменить текст, а затем внесите необходимые изменения.

Кнопки панели инструментов Рисование предназначены для форматирования выбранных объектов, в том числе объектов WordArd.

Для выбора объектов используется кнопка Выбор объекта . Для выбора отдельного объекта достаточно щелкнуть на нем. Что выделить несколько объектов, при каждом щелчке удерживайте нажатой клавишу [Shift] или обведите мышью рамки вокруг всех нужных объектов.

После щелчка на кнопке Цвет заливки открывается меню цветов. Если заливка объекта использоваться не будет, выберите Нет заливки. Заметьте: отсутствие заливки это не тоже самое что белый цвет.

Для изменения цвета линий выбранного объекта щелкните на кнопке Цвет линий — откроется меню цветов.

С помощью команды цвет шрифта можно изменить цвет текста в выбранном объекте, например, в текстовом поле или выноске. Если не выбран ни один объект, то в дальнейшем при создании объектов по умолчанию будут использоваться цвета, которые соответствуют всем трем описанным кнопкам.

Посредством кнопки Тип линии отображается меню типов линий. При выборе команды Другие линии открывается окно Формат автофигуры, где можно задать ширину линий и прочие атрибуты объектов.

Меню Тип штриха позволяет проводить сплошные, пунктирные и штриховые линии, а также использовать различные из комбинации.

В меню Вид стрелки можно указать, как должна выглядеть стрелка. Если стрелка требуемого вида в меню отсутствует, следует выбрать Другие стрелки и в открывшемся диалоговом окне Формат автофигуры создать стрелку, указав вид наконечника, толщину линии, цвет и т.д.

Эффекты тени и объема

Эффекты тени и объема предназначены для того, чтобы придать объекту большую глубину. Можно применить только один из этих эффектов: если применить эффект объема к объекту, содержащему тень, то тень будет удалена, и наоборот.

В меню Стиль тени выбирают тени для выделенного объекта. Для изменения формы тени активируйте команду Настройка тени. Откроется одноименная панель инструментов, которая содержит кнопки, предназначенные для смещения тени влево, вправо, вверх или вниз, а также меню Цвет тени.

Эффект объема можно применить к любому объекту. Кнопки на панели инструментов Настройка объема позволяет задать выпуклость объекта, а также угол поворота, перспективу, направление освещения, текстуру поверхности и цвет. Если при использовании одного из эффектов изменить цвет, вид самого объекта останется прежним.

Меню Рисование панели инструментов программы Word включает несколько операций для манипуляции объектами. Все нарисованные объекты располагаются на отдельных уровнях поверх текста документа.

Для перемещения объекта между слоями вызовите команду Рисование→Порядок и откройте меню порядок. Содержащиеся в нем команды На передний план и На задний план позволяют изменить расположение выбранных объектов относительно текста и других объектов. При работе более чем с двумя уровнями используются кнопки Переместить вперед и Переместить назад, позволяющие сместить выбранный объект на один слой.

В программе Word объекты можно размещать выше или ниже текстового уровня. С помощью команды Поместить за текстом создается подложка для отдельной страницы.

Положение отдельных объектов на рисунке изменяются посредством команд Сдвиг, Выровнять/распределить и Повернуть/отразить, выбранных в меню Рисование. Для работы с мелкими деталями включите отображение сетки на экране. Она поможет правильно выровнять различные объекты в рисунке. Используйте для этого команду Рисование→Сетка.

Группировка и разгруппировка объектов

Когда создание рисунка закончено, можно сгруппировать все нарисованные элементы таким образом, чтобы они рассматривались как один объект.

Для этого выберите требуемые объекты, а затем вызовите команду Рисование→Группировать панели инструментов Рисование. Маркеры изменения размеров каждого из выбранных объектов будут заменены единым набором маркеров, который может использоваться для перемещения нового объекта или изменения его размера.

Если объект содержит несколько элементов, его можно разгруппировать с помощью команды Рисование→Разгруппировать. Вы можете изменить размер каждой составляющей объекта, а также переместить ее, отформатировать или удалить. Это самый простой способ форматирования рисунка. Разгруппировав изображение, измените цвета заливки или удалите фрагмент изображения. После этого отметьте все составляющие объекта и заново их сгруппируйте, для того чтобы иметь возможность перемещать объект целиком и изменять его размеры. Команды группировки и упорядочения вы также можете найти в контекстном меню объекта.

Читать еще:  Как сделать слева оглавление word?

С помощью какой панели инструментов можно создавать в Word рисунки?

Как включить отображение панели Рисование?

Какие группы кнопок находятся на панели Рисование?

В чем отличие рисования в Paint и рисования в Word?

III. Практическая часть.

Теперь потренируемся работать с программой Microsoft Office Word.

Учитель демонстрирует выполнение на экране, учащиеся повторяют на своих рабочих местах.

Запустите Word, найдите панель Рисование. Если панели нет на экране включите ее Вид→Панель инструментов→Рисование.

Выберите инструмент Линия. Появится область для рисования. Нарисуйте в этой области линию (нажмите левую кнопку мыши и перемещайте мышь с нажатой левой кнопкой мыши, когда получите необходимую линию отпустите кнопку мыши).

В любой момент вид линии можно изменить. Достаточно выделить линию одним щелчком мыши. При этом на линии появятся два маркера. Если навести указатель на один из маркеров, то можно изменять размер линии и расположение ее конца.

Если навести указатель на линию, он примет вид четырехконечной стрелки, теперь линию можно перемещать, захватив левой кнопкой мыши.

Теперь используя кнопку Цвет линии, измените ее цвет, выбрав его из меню цветов.

Измените толщину линии, используя кнопу Тип линии.

Сделайте линию пунктирной, используя кнопу Штрих.

Сделайте тень для линии, используя кнопу Тени.

Теперь выберите кнопку Прямоугольник и проделайте те же операции, что мы проделами с линией. Также измените фон прямоугольника и добавьте объем.

Поверните прямоугольник, перемещая зеленый маркер.

Нарисуйте овал и окружность, используя кнопку Овал.

Удалите нарисованные объекты.

Нарисуйте прямоугольник и окружность (попробуйте рисовать окружность с нажатой клавишей [Ctrl]).

Переместите окружность так, чтобы ее часть закрывала прямоугольник. Используя команду Рисование→Порядок, поместите окружность за прямоугольник.

Сгруппируйте объект окружность и прямоугольник. Измените размер получившейся фигуры.

Используя кнопку Автофигуры, нарисуйте звезду.

Теперь самостоятельно создайте три рисунка: схему, домик в ночи и любой свой рисунок. Задание находится в файле C:Наш урокУрок23 Практика.doc.

Учащиеся выполняют задание.

Знать как используя панель Рисование Microsoft Word можно создавать векторные рисунки в текстовом документе, уметь работать этой панелью. Дополнительное задание: найдите информацию о том, какие приложения позволяют создавать векторные рисунки.

V. Вопросы учеников.

Ответы на вопросы учащихся.

Подведение итога урока. Выставление оценок.

На уроке мы познакомились с панелью Рисоване Microsoft Office, научились создавать векторные рисунки в Microsoft Word.

Разработки уроков по информатике

1-й год обучения. 1 час в неделю. Всего 34 часа.

Графика в WORD

ВЕКТОРНАЯ ГРАФИКА

Компьютерная графика:

v это аппаратные и программные средства ввода, создания, вывода изображений;

v это способ наглядного представления данных, в которых присутствуют образы;

v используется в различных областях производственной деятельности (научная, деловая, иллюстративная графика и т.д.);

v наглядно отражает любую информацию, используя более понятные графические способы представления информации.

Графический редактор – прикладная программа для создания, редактирования (обработки) и просмотра графических объектов (изображений) на компьютере.

Графические объекты – рисунки; диаграммы; текст, оформленный графическими средствами; географические карты и т.д.

Векторная графика – предназначена в первую очередь для создания иллюстраций и в меньшей степени для их обработки.

Применяется в рекламных агентствах, дизайнерских бюро, редакциях и издательствах. Оформительские работы основаны на применении шрифтов и простейших геометрических элементов (примитивов), но художественная подготовка иллюстраций средствами векторной графики чрезвычайно сложна.

Программы для обработки компьютерной графики, представленной в векторном формате:

Векторные графические изображения –

J оптимальные средства хранения высокоточных графических объектов (чертежи, схемы), для которых имеет значение сохранение четких и ясных контуров;

J файлы, хранящие векторные графические изображения имеют сравнительно небольшой объем;

J могут быть увеличены или уменьшены без потери качества;

J формируются из объектов (точка, линия, окружность, прямоугольник и пр.), которые хранятся в памяти компьютера в виде графических примитивов и описывающих их математических формул.

Например:

< точка — задается своими координатами (х, у);

< окружность – координатами центра (х, у) и радиусом R;

< прямоугольник – координатами левого верхнего угла (х1, у1) и правого нижнего угла (х22);

ТЕХНОЛОГИЯ СОЗДАНИЯ ВЕКТОРНЫХ РИСУНКОВ В ВЕКТОРНОМ РЕДАКТОРЕ ПРОГРАММЫ WORD

Открытие окна программы Microsoft Word: Пуск – Программы – Microsoft Office — Microsoft Office Word.

Панель Рисование – используется для создания векторных объектов

< Вывод панели на экран: выполните команды Вид – Панели инструментов – Рисование.

< Чтобы не появлялась рамка с надписью «Создайте рисунок» выполните команды: Сервис – Параметры – вкладка Общие – снимите флажок с команды автоматически создавать полотно при вставке автофигур.

Создание автофигур – осуществляется с помощью кнопки Автофигуры

< Вынос панели Основные фигуры на экран: на панели Рисование – щелкните по кнопке Автофигуры – укажите категорию Основные фигуры – наведите курсор мыши на горизонтальную полосу в верхней части палитры Основные фигуры – когда полоса изменит свой цвет, при нажатой левой клавише мыши, переместите палитру на свободное место документа Word.

< Вставка фигуры стандартного размера: щелкните на кнопке выбранной фигуры, затем щелкните левой клавишей мыши в пределах белой страницы в окне программы Word.

< Выделение автофигур: осуществляется щелчком левой клавиши мыши на выбранном объекте (вокруг выделенного объекта появляются маркеры – маленькие кружочки белого цвета), применяется для выполнения дальнейших действий с выделенными автофигурами.

< Перемещение автофигур – наведите курсор мыши на объект так, чтобы появился крестообразный символ и, при нажатой левой клавише мыши, перетащите выделенный объект в нужное место рисунка.

< Изменение размеров объектов – при наведении курсора мыши на маркеры выделенного объекта появляется двусторонняя стрелка , при нажатой клавише мыши растягиваем или сжимаем объект; для сохранения пропорций объекта – изменять его размеры при нажатой клавише Shift.

< Выделение группы объектов – нажмите на панели Рисование кнопку Выбор объектов , при нажатой левой клавише мыши выделите пунктирной линией нужные объекты.

< Группировка и разгруппирование – выделите группу фигур, на панели Рисование в меню Действия (или Рисование) выберите команду Группировать;
чтобы разгруппировать объекты, в меню Действия выберите команду Разгруппировать.

< Цветные фигуры – выделите объект, применяя значок Цвет заливки, нажмите треугольный указатель справа от него на панели Рисование, откройте палитру цветов и выберите нужный цвет.

< Градиент – плавный переход между двумя или несколькими цветовыми оттенками, для его создания в меню Цвет заливки щелкните на кнопке Способы заливки, откройте вкладку Градиентная, установите флажок два цвета, в меню Цвет 1 и Цвет 2 выберите нужные оттенки, определите Тип штриховки и Варианты, просмотрите Образец, ОК.

Создание сложного рисунка в векторном редакторе Word и растровом редакторе Paint

Для создания рисунка с помощью встроенного графического редактора Word следует выполнить следующие действия:

  • • создать новый документ, развернуть окно документа;
  • • вывести на экран непечатаемые символы;
  • • ввести текст;
  • • после, например, первого абзаца текста вставить несколько пустых абзацев, используя принудительный перевод строки с помощью комбинации клавиш Shift+Enter;
  • • создать с помощью инструментов панели Рисование рисунок, используя фигуры прямоугольника и овала, стрелки, надписи, цвета, действия; сохранить файл;
  • • объединить элементы рисунка можно, выделив его (нажав клавишу Shift и щелкая по элементам мышью или с помощью кнопки Выбор объектов на панели Рисование);
  • • далее рисунок следует сгруппировать с помощью кнопки Действия и команды Группировать;
  • • чтобы убедиться, что все элементы рисунка сгруппированы, нужно его переместить;
  • • для привязки рисунка к абзацу следует рисунок выделить, а символ якоря перетащить мышью к нужному абзацу; введя команды ФорматОбъект —» Рисунок/Автофигуры, на вкладке Положение установить соответствующий переключатель.

Создать в документе с многослойным рисунком объект WordArt и отредактировать его с помощью панели WordArt и кнопок на панели Рисование.

Создать в документе любую плоскую автофигуру, изменить ее размер и скопировать (перетащив ее мышью при нажатой клавише Ctrl), используя кнопку Автофигуры.

Для запуска программы Paint следует последовательно выбрать пункты меню Пуск -> Программы -» Стандартные -> Графический редактор Paint. На экране появится окно Paint с чистым рабочим полем для рисования, панелью инструментов, палитрой цветов и указателем координат курсора. Размеры рабочего поля можно менять (растянуть по горизонтали, вертикали, диагонали; свернуть, развернуть, восстановить).

Читать еще:  Как сделать цветным фон в word?

Палитра цветов Paint позволяет работать сразу с двумя цветами: цветом переднего плана и цветом фона. Цветом переднего плана (основным цветом) обычно закрашиваются основная часть рисунка и текстовые символы. Два смещенных относительно друг друга прямоугольника в левой части палитры указывают текущие цвета: верхний — основной, нижний — цвет фона. Изменение цветов осуществляется следующим образом: основного — щелчком левой кнопки мыши по любому из цветов палитры, цвета фона — щелчком правой кнопки.

Панель инструментов. Каждый инструмент обозначен небольшой кнопкой (пиктограммой). Щелчком мыши по кнопке можно активизировать выбранный инструмент.

Выделение произвольной области. Указатель мыши принимает вид крестика. Нажав левую кнопку мыши, можно перемещать его в области рисунка, при этом выделяя произвольную область рабочего поля. Если клавишу отпустить, то нарисованная линия превратится в пунктирный прямоугольник. Эту выделенную область можно преобразовывать с помощью команд меню Правка (поместить в буфер обмена, удалить или переместить в другую часть рисунка). Выделить сразу весь прямоугольник можно с помощью инструмента Выделение.

Ластик/Цветной ластик. Указатель мыши превращается в квадратный ластик. Нажав левую кнопку мыши и перемещая ластик, можно закрасить поверхность цветом фона. Если цвет фона белый, то ластик просто стирает участки рисунка. Нажав правую кнопку мыши, можно пользоваться цветным ластиком. При этом стираемый цвет выбирается как основной, а цвет фона — белым. Размер ластика выбирают с помощью дополнительного раздела в левой нижней части панели инструментов.

Заливка. Указатель превращается в копию кнопки Заливка. Если кончик «льющейся струи краски» расположить в замкнутой области и щелкнуть левой кнопкой мыши, то область закрасится основным цветом, если правой — цветом фона.

Выбор цветов. Указатель мыши принимает вид пипетки. Следует указать пипеткой на объект, цвет которого нужно скопировать, и щелкнуть левой кнопкой мыши. Произойдет копирование выбранного цвета в основной цвет (при этом в смещенных друг относительно друга прямоугольниках верхний окрасится скопированным цветом). Если необходимо скопировать цвет фона или ластика, то следует щелкнуть правой кнопкой мыши.

Масштаб. С помощью этого инструмента можно увеличивать или уменьшать изображение в несколько раз.

Карандаш. Курсор принимает вид карандаша. Нажав левую кнопку мыши, рисуют произвольные фигуры линиями толщиной в один пиксель, в основном цвете. Нажав правую кнопку мыши, можно рисовать в цвете фона.

Кисть. Указатель мыши принимает вид крестика. Им рисуют фигуры так же, как и карандашом. Можно выбрать форму кисти, ее толщину, форму мазка. Форма кисти выбирается с помощью дополнительного раздела, который появляется в нижней части панели инструментов при активации кнопки Кисть.

Распылитель. Указатель мыши превращается в «струю аэрозольного баллончика». Нажав левую кнопку мыши и перемещая указатель по экрану, окрашивают поверхность струями (мазками) в основном цвете.

Ширину мазка выбирают с помощью дополнительного раздела, который появляется в нижней части панели инструментов при активации кнопки Распылитель. Нажав правую кнопку мыши, можно «распылять» цвет фона.

Надпись. Позволяет вводить текст в поле рисунка. Выбрав этот инструмент и нажав левую кнопку мыши, рисуют текстовую рамку. Щелкнув мышью внутри рамки, набирают текст. Открыв меню Вид и установив флажок Панель атрибутов текста, выбирают нужный шрифт, его размер и стиль. Цвет текста устанавливают с помощью дополнительного раздела, который появляется в нижней части панели инструментов при активации кнопки Надпись.

Линия. Указатель мыши принимает вид крестика. Им проводят прямые линии.

Кривая. Указателем мыши рисуют прямую линию, а затем, потянув в любом месте в нужном направлении, можно изогнуть ее в дугу разного вида.

Геометрические фигуры. Набор инструментов: прямоугольник, многоугольник, эллипс, скругленный прямоугольник. Перемещая курсор, рисуют названные выше фигуры. Они могут быть неокрашенными/иметь основной цвет. Окрашивание внутри контура или без наружного контура достигается выбором соответствующей фигуры в дополнительном разделе, который появляется в нижней части панели инструментов при активации кнопки этой фигуры. Нажав правую кнопку мыши, можно «распылять» цвет фона.

Дополнительные возможности редактора:

  • 1. Меню Рисунок. Команда Отразить/повернуть. позволяет отразить картинку (слева направо или сверху вниз) и повернуть ее на угол 90, 180, 270°. Команда Растянуть/наклонить. позволяет изменить пропорции изображения.
  • 2. Меню Правка. Команда Очистить выделение позволяет очистить выделенный фрагмент. Можно отменить не одну, а три последовательно выполненные операции.

Для рисования сложного рисунка в векторном редакторе Word и растровом редакторе Paint нужно выполнить следующие действия:

  • 1. Запускаем программу MS Word. С помощью команд Вид Панели инструментов -» Рисование выводим на экран панель Рисование. Изучаем все инструменты панели Рисование. Для создания рисунков выполняем следующие действия:
    • • создаем документ с именем H3o6p.doc, открываем окно документа;
    • • выводим на экран непечатаемые символы;
    • • создаем с помощью инструментов панели Рисование рисунок и сохраняем файл;
    • • объединяем все элементы рисунка;
    • • создаем в документе объект WordArt, редактируем его;
    • • группируем рисунок;

На экране получаем следующий рисунок (рис. 5.19).

Рис. 5.19. Рисунок, созданный в программе Word

  • 2. Запускаем программу Paint. Изучаем палитру цветов и панель инструментов. Для создания изображения выполняем следующие действия: в рабочем поле создаем рисунок, делаем надпись, окрашиваем рисунок и надпись, редактируем созданное изображение (рис. 5.20).
  • 3. Сохраняем изображение в графическом файле с расширением .bmp и копируем его в ранее созданный с помощью текстового редактора файл, группируем. На экране получаем сложный многослойный рисунок с надписями (рис. 5.21).

Рис. 5.20. Рисунок, созданный в программе Paint

Рис. 5.21. Окончательный вид рисунка

  • 1. Каковы назначение и основные функции векторного графического редактора?
  • 2. Как создать рисунок в редакторе Word?
  • 3. Каковы назначение и основные функции растрового графического редактора?
  • 4. Как создать рисунок и надпись в рабочем поле редактора Paint?
  • 5. Как создать многослойный рисунок?

Word2Vec: покажи мне свой контекст, и я скажу, кто ты

Технология Word2Vec работает с большим текстовым корпусом и по определенным правилам присваивает каждому слову уникальный набор чисел — семантический вектор. Помните, как мы складывали и вычитали векторы в школе? Точно так же, если из вектора слова король вычесть вектор мужчина и прибавить вектор женщина, получатся числа, соответствующие слову королева.

Никто явно не указывал эти закономерности — они напрямую следуют из того, каким способом слова получают свои наборы чисел.

Как можно представить смысл слова в виде чисел? Специальный код для каждой буквы?

Нет. С точки зрения семантического вектора смысл спрятан не внутри слова, а сосредоточен в его контексте. Вектор показывает, как часто слово встречалось рядом с другими словами.

Вся идея семантических векторов основана на дистрибутивной гипотезе. Она состоит в том, что смысл слова заключается не в наборе его собственных звуков и букв, а в том, среди каких слов оно чаще всего встречается. То есть смысл слова не хранится где-то внутри него, а распределен между элементами его возможных контекстов, отсюда и название — дистрибутивная гипотеза.

Если подходить к тексту с этой позиции, то котёнок окажется сильнее связан по смыслу с щенком, потому что оба они встречаются рядом со словами милый, пушистый, маленький. В то же время со словом стол котёнок почти не будет связан — котята редко бывают ровными, пластиковыми и деревянными.

А откуда цифры?

Представьте себе квадратную таблицу, в которой каждая строчка — это какое-то слово из словаря большого текстового корпуса. Они идут по порядку: абажур — первая строчка, Абакан — вторая, ящур — последняя. Столбцы — это те же самые слова, и они тоже идут по порядку. В ячейке на пересечении столбца и строки пишется число раз, которое слово из строки встретилось в корпусе рядом со словом из столбца.

Вот и всё, семантические вектора готовы: ими станут строки нашей таблицы. Посмотрите: в примере строка редис кодирует информацию о том, что слово редис встретилось рядом с картошка 5 раз, в то же время встретилось рядом с кот лишь однажды, а с собака не встретилось вообще. Похожим образом ведёт себя и картошка: слово встречается рядом с названиями овощей часто, а с видами животных — редко. Так вот, если записать первую строку таблицы как (5; 1; 0), получится трехмерный вектор, в этом упрощённом примере он кодирует смысл слова редис. Если элементы векторов похожи, при их математическом сравнении окажется высока специальная мера схожести под названием «косинусная близость».

Если семантические векторы двух слов «косинусно близки» по отношению друг к другу, лингвист делает вывод: эти векторы принадлежат словам, близким по смыслу в человеческом понимании.

Читать еще:  Как сделать в word нумерацию заголовков в?

«Встретились рядом» — это где?

Итак, в ячейках таблицы пишем число раз, которое слово из столбца и слово из строки встретились в корпусе «рядом», то есть на расстоянии не более N слов. Это расстояние лингвисты называют «шириной окна» поиска, его настраивают вручную. Сейчас принято использовать N = 10. При обработке текст разбивается на отрывки из подряд идущих N слов (их называют N-граммы, здесь можно узнать больше), затем считается количество N-грамм, в пределах которых встретились два слова. Если два слова встретились внутри N-граммы, в ячейку на пересечении нужного столбца и строки добавляется единица. Можно сравнить N-грамму с мыльным пузырём, который движется через текст: если два слова попали в него одновременно — они «стоят рядом».

Для чего вообще все это нужно?

С многомерными векторами (то есть с векторами, состоящими из большого числа элементов) можно делать всё то же самое, что и с привычными двумерными — складывать их, вычитать, даже строить пропорции. Что самое интересное — при сложении векторов двух слов получается вектор третьего слова, и оно «суммирует» смыслы двух слагаемых в человеческом понимании, иногда неожиданно или даже поэтично. Если вычесть вектор слова король из вектора слова королева, получится абстрактное представление о роде, выраженное в числах. Теперь если эту разность прибавить к вектору слова лев, то получится, скорее всего, львица. Это может быть полезно при автоматическом анализе текста в поисковиках, чат-ботах и голосовых помощниках. А ведь компьютер просто складывает и вычитает числа, никакого представления о том, что такое род слова, в него не заложено!

А если рассчитать семантические векторы слов на примере двух одинаковых коллекций текстов на разных языках, векторы слова и его перевода будут похожи (если не одинаковы) — пригодится для создания онлайн-переводчика.

Посмотрите, что умеет «семантический калькулятор» с сайта RusVectores. Он основан на тех же принципах и умеет складывать и вычитать векторы, строить пропорции между ними. Что, например, так же относится к слову Италия, как Москва к России?

Но на практике пользуются не этой таблицей, а нейросетью. Почему?

Таблица получается слишком большой и заполненной нулями. Компьютерные лингвисты работают с объемными текстовыми коллекциями, и в них количество уникальных слов легко переваливает за сотни тысяч, а то и больше. Если использовать нашу таблицу, вектор каждого слова крупного корпуса состоял бы из ста тысяч элементов. Но что еще хуже — почти все элементы оказались бы нулями, потому что есть слова, которые вообще никогда не встречаются друг с другом в текстах. Знаменательные слова встречаются с небольшой, «своей» группой соседей, определяющей их смысл, в то время как служебные встречаются со всеми подряд.

Итак, получилась слишком большая таблица, состоящая в основном из нулей. Математики придумали много способов «сжать» ее, оставив только нужные сведения: к таким методам относятся, например, сингулярное векторное разложение и случайное индексирование.

Но зачем строить большую и непонятную таблицу, чтобы потом ее сокращать, если можно сразу придумать маленькую и удобную? Так и поступил ученый из Чехии Томаш Миколов, предложивший в 2013 две нейросетевые архитектуры: CBOW и Skip-Gram.

Как устроен Skip-Gram?

В машинном обучении есть такой трюк: можно изобрести задачу и натренировать нейросеть со скрытым слоем нейронов решать её, а потом просто не использовать нейросеть для решения этой задачи. Так поступает и Skip-Gram. Тренировка нейросети на самом деле нужна, чтобы запомнить веса нейронов, полученные в ходе обучения: в нашем случае веса как раз и станут семантическими векторами, которые мы пытаемся получить.

Если вы новичок в нейронных сетях и не понимаете, о чем речь — прочитайте наш пост на эту тему.

Фальшивая задача следующая: дано конкретное слово в середине предложения (входное слово). Алгоритм наугад выбирает одно слово из близких к входному и для каждого слова в словаре предсказывает вероятность того, что наугад выбрали именно его.

Предсказания показывают, насколько вероятно найти то или иное слово возле входного. Кстати, у слова «возле» здесь тоже есть конкретный смысл: это выбранная «ширина окна», или N-граммы.

Например, если обученной нейросети подать на вход слово котик, высокие вероятности на выходе будут присвоены словам пушистый, маленький, милый, более низкие — не связанным с котиками словам, например фламинго или ананас.

В каком виде нейросеть получает данные?

Нейронные сети не работают со словами в виде текстовых строк, они работают с числами. Чтобы обозначить каждое словарное слово уникальным номером, пользуются методом «one-hot encoding». Его суть проста: представьте, что в словаре 10 000 слов. Номер каждого слова будет состоять из 10 000 цифр, и все они будут нулями — кроме одной единицы. Единица будет стоять на месте, которое слово занимает в словаре по алфавиту. Третье по счету слово в словаре будет закодировано так: 00100(и еще 9995 нулей). Такое представление данных называется one-hot вектором.

А из чего вообще эта нейросеть состоит?

Вот ее архитектура:

Входной one-hot вектор, кодирующий слово по положению в словаре, подается на скрытый слой нейросети, где превращается в другой вектор (как — расскажем далее). Новый вектор попадает на выходной слой и умножается на 10 000 наборов разных чисел (уникальный для каждого из 10 000 слов в словаре). Затем специальная функция Softmax превращает каждый получившийся набор в число между 0 и 1 — выходное число. Сумма 10 000 выходных чисел даёт единицу. Каждое из выходных чисел показывает, какова вероятность встретить слово данного выходного нейрона рядом с изначально заданным словом.

Теперь разберемся, что происходит на скрытом слое.

Скрытый слой нейросети

Задача: сформировать семантический (не one-hot!) вектор из фиксированного количества элементов, то есть чисел. Элементов обычно 300. Каждый элемент также называют признаком слова, которому вектор принадлежит. «Выучить признаки» — значит получить вектор.

Сразу же при подаче на вход нейросети one-hot вектор попадает на скрытый слой нейросети. Там он умножается на таблицу (матрицу) весов. Размеры таблицы — 300 (по числу нейронов) на 10 000 (по числу слов в словаре, их может быть больше).

Получение чисел в этой таблице на самом деле и является подлинной целью обучения нейросети. Ведь если посмотреть на ее строки, то как раз и получатся семантические векторы с фиксированным числом элементов. А выходной слой после тренировки нейросети мы отбросим.

One-hot encoding хорош тем, что умножение вектора в таком формате на матрицу — все равно что выбор конкретной строки.

Откуда нейросеть возьмёт числа на скрытом и выходном слое?

Это самая непростая часть, ради которой всё и затевалось. За неё отвечает процесс тренировки нейросети. Большая таблица 300×10 000, из которой мы потом станем брать готовые вектора, в самом начале заполнена случайными значениями.

Обучение выглядит так: N-грамма уже «прошлась» по тренировочному тексту и записала, что слово под номером 2 в словаре (это был абажур) встретилось рядом со словами номер 4581, 313 и 939. Все эти данные хранятся в виде one-hot векторов. Вектор «абажура» будем называть входным, а векторы его соседей — выходными. Входной и выходной вектора взаимосвязаны, вместе они образуют тренировочный пример для слова абажур. Тренировочных примеров — миллионы.

Суть процесса обучения — много раз заставить нейросеть предсказать, какие слова вероятнее всего встретить рядом с абажуром. Она много раз ошибется и каждый раз будет смотреть на то, какие вектора должны были получиться, то есть какие выходные вектора связаны с входным. В конце концов методом проб и ошибок алгоритм будет понемногу корректировать изначальные случайные значения и в итоге подберет те самые веса, на которые нужно умножать вектор абажура, чтобы получить вектора правильных слов. А потом придет человек, заберёт веса и скажет, что это — семантический вектор абажура.

Создатель нейросети вычисляет подходящую функцию потерь (штрафовать нейросеть за ошибочные предсказания — ее работа), обрабатывает не по одному слову за раз, а «комплектами» по 64 слова и применяет разные хитрые уловки вроде исключения самых частотных слов из обработки (негативное сэмплирование).

Мы сознательно опустили множество деталей, в том числе — не рассказали, как математически выглядит подбор нужных весов нейронов для правильного предсказания векторов (речь идет о «градиентном спуске»). Зато теперь вы знаете, как можно превратить слово в набор чисел, выразив ими его смысл.

Ссылка на основную публикацию
Adblock
detector