技術ドキュメントは全ての記述を変更することは多くありません。大抵幾つかの仕様が変更され、ドキュメントの修正が行われます。
事前にドキュメントを分割して翻訳しておけば、変更された部分以外に関しては翻訳が既存のものを流用できます。
本サービスはそれを利用したものです。
Taiyaq は、以下の手順で対訳の作成を進めていきます。
ある翻訳したいサイトがあります。そこで新規の対訳作成を選ぶと以下の手順が始まります。
翻訳対象サイト を一定単位で分割します。同じコンテンツは同じ分割方法に従い毎回同じように分割されます。
これによって翻訳対象を分割します。
対訳は前後の翻訳対象のハッシュも記憶しておきます。つまり 1 つの対訳は次の情報を対訳とは別に保持します。
これは後述する翻訳処理で使われます。
上記分割した翻訳情報を翻訳して対訳をつくっていきます。
この情報をもとに対象サイトの翻訳を行います。
Taiyaq は以下の手順によって翻訳を行います。
ある翻訳したいサイトがあります。そこで翻訳を実行すると以下の手順が行われます。
翻訳対象サイト を一定単位で分割します。同じコンテンツは同じ分割方法に従い毎回同じように分割されます。(対訳作成の分割と同じ)
これによって翻訳元となる情報を作成します。
翻訳を行います。但し前述したハッシュ情報を使い大きく3つのパターンに分けて翻訳を実行します。
これは前後の翻訳元のハッシュと翻訳対のハッシュ(3 つのハッシュ)が完全一致した場合に翻訳されます。完全一致なので最優先で翻訳を実行します。
これは前後何れかのハッシュが一致しない場合に翻訳を実行されます。これは前後何れかの翻訳元が変更された場合に実行されます。
部分一致でも翻訳を行いますが完全一致の翻訳が全て終わり残った翻訳対象に対して実行されます。
前後ともハッシュが一致しない場合に翻訳を実行しますこれは前述した完全一致, 2 個所一致 にて翻訳した残りの翻訳に対して実行されます。
この仕組みを逆用してタイトル、目次で共通の文言があった場合に敢えて未翻訳とすることで共通個所の翻訳に利用できます。
全てのハッシュが一致しない場合に翻訳をしません。その対訳はもはや翻訳対象外となります。
上記ルールによって翻訳が実行されます。