Czytelnia / Technologie tłumaczeniowe

Drugim głównym podejściem „opartym na korpusie” – i również korzystającym z ulepszonego szybkiego dostępu do dużych korpusów tekstowych – jest tak zwane podejście „oparte na przykładach” (lub „oparte na pamięci”). Po raz pierwszy zostało ono zaproponowane w 1984 roku przez Makoto Nagao jakkolwiek dopiero pod koniec lat 80-tych rozpoczęto doświadczenia (początkowo przez grupy japońskie i podczas projektu DLT, o czym wspomniano już wcześniej). Podstawowa hipoteza zakładała, że tłumaczenie często dotyczy wyszukania lub przywoływania przykładów analogicznych, tj. tego, jak poszczególne wyrażenia lub pewne podobne zdania były tłumaczone wcześniej. Podejście oparte na przykładach składa się z procesów usuwania i wybierania ekwiwalentów zdań lub grup słów z baz danych równoległych tekstów dwujęzycznych, które zostały ułożone/uporządkowane albo metodami statystycznymi (być może podobnymi do tych używanych przez grupę IBM) lub przez bardziej tradycyjne oparte na regułach metody analizy morfologicznej i składniowej. W celu obliczenia możliwych par, niektóre grupy MT używają metod semantycznych, np. sieci semantycznej lub hierarchii (tezaurusa) terminów z danej dziedziny.