やまと歌

YAMATO・UTA、UTAYOMi、UGUHiSU、KASENは、株式会社クレステックの登録商標です。
Internet Explorer、Microsoft、およびWindowsは、米国Microsoft Corporationの、米国およびその他の国における登録商標または商標です。

文書比較/日本語精査/改め文生成モジュール・ソフトウェア:やまと歌
やまと歌(YAMATO・UTA)は契約書や公文書、マニュアルやウェブコンテンツなどの校正作業効率化、日本語品質の向上を目的に開発されたソフトウェア群の総称です。各ソフトウェアは機能モジュールとして提供され、既存システムへの組み込みが容易となるように設計されているため、様々なシステムへの組み込みが可能です。
また、文書データベースとの連携により、高度な日本語精査も実現可能な画期的なソフトウェアモジュール群です。
やまと歌は次の3つの機能モジュールから構成されています。
1. 文書比較モジュール “ 歌詠(UTAYOMi)”
2. 日本語精査モジュール “ 鶯(UGUHiSU)”
3. 改め文生成モジュール “ 歌仙(KASEN)”
文書比較 : 歌詠(UTAYOMi)
版管理や差分のエビデンス、新旧対照表の自動作成を目的に2文書間の相違を多角的に明示します。差分の順次比較モード(2文書間の段落を対応させ差異を明示するモード)と、類似度優先モード(1つの段落に対し、最も類似した段落や類似していると見なされる段落を全て列挙するモード)など、実行オプションを指定できます。
ご利用例) 契約書の比較
・前年度との比較
・自社規定と他社契約書との比較など
日本語精査 : 鶯(UGUHiSU)
送信前の電子メールや、公開前のWebページなど、日本語の校正支援を目的に入力された日本語文章を指摘パターンと照合し、パターンに一致した場合、メッセージを出力します。パターンファイルは、対象文書毎に適合した精査ができるようにカスタマイズ容易なフォーマットになっています。
ご利用例) ウェブコンテンツや公開文書などの確認として
・公開前の日本語精査
・不愉快語や登録商標の検出など
改め文生成モジュール : 歌仙(KASEN)
新旧対照表の情報を元に改め文を作成します。本機能はお客様個々の改正規定に関するルールに合わせた出力を実現するために完全カスタマイズ開発となります。
ご利用例) 約款、条例の改正内容の自動生成
・約款改正に伴う監督省庁への提出書類
・条例改正に伴う改め文
※下記で使用している画面はMicrosoft® Internet Explorer®での表示例です。
類似度の調整
本システムの比較では、指定された類似度以上の文章をペアとみなして、差分を表示します。
指定する類似度を調整することによって、差分の検出精度を変更できます。
※文章類似度:文字列の編集距離(Levenshtein距離)とペアとなった文章の対象要素数から算出します。
類似度優先での比較
比較文書内の出現位置に関わらず、類似度の最も高い文章をペアとします(横に並べます)。
類似度優先での比較
比較文書内で類似した文章を検出します。
表現のゆれの検出
文書内にある段落、文すべてを比較し、類似したものをペアとして表示します。この機能により、例えば、取扱い説明書を対象にすると、以下のような文章表現のゆれを発見できます。
誤入力チェック
・誤字脱字チェック
・漢字/ひらがな使い分けチェック

誤入力チェックの例①
・漢字の誤りチェック
・活用形の誤りチェック
・敬語の誤りチェック
誤入力チェックの例②
用字・用語チェック
・差別語/不快用語チェック
・誤りやすい用字・用語チェック
用字・用語チェックの例
・登録商標チェック

用字・用語チェックの例
表現のチェック
・「ら抜き言葉」チェック
・「さ入れ言葉」チェック
・「い抜き言葉」チェック
表現チェックの例①
・可能表現チェック
・慣用句の誤りチェック

表現チェックの例②
金融業における開発事例
新旧の約款を比較して自動生成された下図の対照表をもとにして、監督省庁への提出書類である改正規定を自動生成する例を示します。
この対照表の結果からは、旧約款中の第2号が変更されたことと、新約款には旧約款には対応しない第3号が存在することが検出されます。したがって下のような文章を自動生成し、それを表示します。
改正規定を作成するには、法制執務上の厳密な手法が要求されますので、人出で作成するには、知識と労力が必要です。本機能を用いることによって、その負担を少しでも軽減することができます。
やまと歌(YAMATO・UTA)が持つ豊富な機能郡の中からパーソナルでも使える機能を抜き出したPCアプリもご用意しております。
動作環境
OS Windows® XP/Windows® Vista/Windows® 7/Windows® 8
ブラウザ Internet Explorer® 8 以降を推奨
メモリ メインメモリー容量1GB以上。快適に利用するためには2GB以上を推奨
対象文書 Word文書(.docx)、Word97-2003文書*(.doc)、リッチテキスト形式*(.rtf)、テキスト形式(.txt、.xml、その他 .html などテキストファイルとして指定可能)
*Microsoft® Word 2007以降が必要です。
価格
定価 100,000円(税別)
お問い合わせ先
機能モジュールの組み込み開発に関するご相談やアプリ版に関するお問い合わせは以下の窓口になります。
やまと歌担当:yamato-uta@crestec.co.jp
お問い合わせから2営業日以内にご連絡差し上げます。
研究開発技術
1.シンポジウムにおける研究発表実績
発表年月日 大会名 主催者 講演タイトル
2012/11/30 第2回特許情報シンポジウム アジア太平洋機会翻訳協会、一般財団法人 日本特許情報機構 特許翻訳の品質を向上させるための形態素解析結果を利用した文書比較・日本語精査ツールの試作
2013/3/1 第4回産業日本語研究会シンポジウム 高度言語情報融合フォーラム、一般社団法人 言語処理学会、一般財団法人 日本特許情報機構 多角的な文書比較『歌詠』とカスタマイズ容易な日本語精査『鶯』
2.書籍での研究発表
掲載年月日 書籍名 編集者 タイトル
2014/12/1 Japio YEAR BOOK 2014 一般財団法人 日本特許情報機構 文書比較結果の多目的利用
2015/12/1 Japio YEAR BOOK 2015 一般財団法人 日本特許情報機構 明細書からの用語抽出と明細書間で共通する用語の出現頻度に基づく類似度算出
命名の由来
日本語固有の平仮名文字が、我が国で初めて公的な文書として使用されたのは「古今和歌集」の序文「仮名序」です。この冒頭「やまと歌は 人の心を種として よろづの言の葉とぞなれりける」から命名しました。下記モジュール実行環境の総称です。
日本語精査 「仮名序」の中の一節「花になくうぐひす」から命名しました。鶯の美しいさえずりを聞くと、祖先が古から伝えてきた日本語をいつまでも大切にしたいという思いになります。
文書比較 うぐいすは、別名「歌詠鳥(ウタヨミドリ)」とも呼ばれています。平安美人たちが月夜のもとで歌を詠み比べる様子が「文書比較」にぴったりと考え「うたよみ」と命名しました。
改め文生成 ある文章から新たな別の文章をリズムよく作り出すモジュールの命名として、季節の移り変わりからその気配を読み取って和歌を作り出す歌人(歌仙)をイメージしました。
※歌仙はオプション機能です。本機能は、既存の法令を一部改正する法令において用いられる文章の形式を自動生成します。
INFORMATION
本システムは、形態素解析エンジンとしてMeCabを使用しています。
MeCabは 京都大学 大学院情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです。 また日本語辞書としてMeCab用の辞書の1つである独立行政法人 情報処理推進機構(IPA)の辞書を採用し、これを大幅に拡張しています。