Идеята за машинния превод възниква още със създаването на първите компютри в периода, след края на Втората световна война. Постигането на качествен резултат е една от най-важните задачи пред компютърните специалисти. Обективните разлики между езиците усложняват автоматичния превод, както и липсата на дълбоко разбиране на смисъла на превеждания текст от машината. Нека проследим как протича човешкият превод? Последователността в този случай е представена от четене и разбиране на текста, след което се генерира превод на съответния език. Преводачът свързва фразови фрагменти и ги обединява в цяло изречение. Не се превежда простото изречение, чрез дълбок лингвистичен анализ. Естествено изискване за качествен писмен превод е лицето да владее и двата езика. За сравнение, компютърът не е носител на езиците и задачата пред него е в сферата на математическата лингвистика.
Важно е да обърнем внимание и как хората учат родния си език. От ранна възраст детето слуша разговори между носители на езика, т.е неговите родители и роднини. След това започват да възпроизвеждат първите си думи. Научаването на втори език е по-трудно и обикновено се постига чрез прилагане на правила, примери, правопис на дадения език. Трудността идва от липсата на комуникация с носители на чуждия език. Става все по-трудно овладяването му с увеличаване на възрастта при хората.
Двата основни подхода при машинния превод – статистически подход и лингвистичен подход, се основават на подобни практики както и при осъществяване на превод от друг човек.
Статистическият подход извлича информация от големи части текстове. За машинния превод се изисква да са налични паралелни текстове на два езика. Така се превеждат отделни думи, фрази и цели изречения. Колкото е по-голям текстът, толкова по-точен е преводът.
При програмите за проверка на правопис е достатъчно текстовете да са на един език. Такива са Google search и Google translate. Те разчитат на статистически подходи. При използване на онлайн услугите за машинен превод, се постига единствено приблизителен превод. Те са неприложими за високо специализирани текстове и не дават цялостна интерпретация. Могат да се използват само за най-разпространените езици. Приложението на онлайн услугите е предимно любителско.
Вторият подход е лингвистичният. Специалисти лингвисти създават списък от термини, правила и създават системи базирани на правила, които заемат много време и специализиран човешки труд. Експертите могат по-прецизно да обработват информацията и да поправят възникналите грешки. Лингвистичният подход е по-надежден, но е свързан с много финансови средства и затова обхваща най-разпространените езици. Проучванията в момента са ориентирани към смесени подходи, които използват както статистическия, така и лингвистичния метод.
Въпреки своите недостатъци, машинният превод е приложим, когато е достатъчно предаването на най-общия смисъл на текста. Автоматичният превод е и в помощ на професионалните преводачи. Това се постига чрез натрупване на памети в специализирани програми за превод. Редактирането на компютърен превод е предпочитан от много специалисти. Това им спестява време от цялостното набиране на текста.
През последните години машинният превод е обект на повишен интерес, но все още не е постигнато високото му качество. Нужни са много средства за усъвършенстването му и внедряване на нова комбинирана технология.
