FC2ブログ

AppleScriptによる日本語形態素解析(Morphological Analysis)

ぴよまるソフトウェアさんでAppleScriptにおけるCocoaを用いた簡易日本語形態素解析の話題が出ていたので、拙作 TextEncodingObjの結果と比較してみました。元のテキストは当ブログの前回の記事の文章の一部です。

「QuickTimeによる設定と一口に言っても、QuickTime 7が利用できる場合はMPEG Exporter TNGが独自に複数の変換設定の定義ファイルを持っているので、それを利用します。QuickTime Xの環境下では、アップルが定めたプリセットしか使用できません。CoreMediaと呼ばれるOS X独自の変換コマンドが利用できる環境下では、それも利用できます。MPEG Exporter TNGは、利用できる変換機能の一覧を生成して、簡単なメニューで選択できるようにします。」



AppleScript自体の「words of」の結果(OS X 10.9.5、おそらく Mecab):

{"QuickTime", "に", "よる", "設定", "と", "一口", "に", "言っ", "て", "も", "Quick", "Time", "7", "が", "利用", "できる", "場合", "は", "MPEG", "Export", "e", "r", "T", "N", "G", "が", "独自", "に", "複数", "の", "変換", "設定", "の", "定義", "ファイル", "を", "持っ", "て", "いる", "の", "で", "それ", "を", "利用", "し", "ます", "Quick", "Time", "X", "の", "環境", "下", "で", "は", "アップル", "が", "定め", "た", "プリ", "セット", "しか", "使用", "でき", "ませ", "ん", "CoreMedia", "と", "呼ば", "れる", "OS", "X", "独自", "の", "変換", "コマンド", "が", "利用", "できる", "環境", "下", "で", "は", "それ", "も", "利用", "でき", "ます", "MPEG", "Export", "e", "r", "T", "N", "G", "は", "利用", "できる", "変換", "機能", "の", "一覧", "を", "生成", "し", "て", "簡単", "な", "メニュー", "で", "選択", "できる", "よう", "に", "し", "ます"}



TextEncodingObjのsolvePhrase(msg)ハンドラの結果(TextEncodingObj ver.2.2):

{"QuickTimeによる", "設定と", "一口に", "言っても", "、", "QuickTime 7が", "利用できる", "場合は", "MPEG Exporter TNGが", "独自に", "複数の", "変換設定の", "定義ファイルを", "持っているので", "、", "それを", "利用します", "。", "QuickTime Xの", "環境下では", "、", "アップルが", "定めた", "プリセットしか", "使用できません", "。", "CoreMediaと", "呼ばれる", "OS X独自の", "変換コマンドが", "利用できる", "環境下では", "、", "それも", "利用できます", "。", "MPEG Exporter TNGは", "、", "利用できる", "変換機能の", "一覧を", "生成して", "、", "簡単な", "メニューで", "選択できるようにします", "。"}



ほお。悪くない。

元ネタはこちら。
簡易日本語形態素解析のじっけん(AppleScriptの穴)

OS X 10.10は使っていないので、JparseKitの結果はわかりませんが、Mecabとほぼ同じとのこと。
 
テーマ: Mac | ジャンル: コンピュータ

コメント

コメントの投稿


管理者にだけ表示を許可する