Skip to content

句読点挿入を自然にする #37

@greymd

Description

@greymd

本 Issue は直近で本腰をいれて取り組むつもりはないです。
単に備忘録として Issue に残してます(なのですぐ Close するかも)。

問題

句読点挿入の際、助詞と助動詞の後に挿入するルールは、初期開発の段階で私が手元で kagome を動かして適当な感覚で決めたものなのでもっとナチュラルにできる気はしている。
助動詞、助詞の挿入条件をもっと厳しくしてもよいかもしれない。

一例を示す

$ ojichat | kagome
章恵    名詞,固有名詞,人名,名,*,*,章恵,アキエ,アキエ
ちゃん  名詞,接尾,人名,*,*,*,ちゃん,チャン,チャン
、      記号,読点,*,*,*,*,、,、,、
オハヨー        名詞,一般,*,*,*,*,*
😃      記号,一般,*,*,*,*,*
☀       名詞,サ変接続,*,*,*,*,*
        記号,空白,*,*,*,*,*
😃      記号,一般,*,*,*,*,*
✋❗    名詞,サ変接続,*,*,*,*,*
章恵    名詞,固有名詞,人名,名,*,*,章恵,アキエ,アキエ
ちゃん  名詞,接尾,人名,*,*,*,ちゃん,チャン,チャン
にとって        助詞,格助詞,連語,*,*,*,にとって,ニトッテ,ニトッテ
素敵    名詞,形容動詞語幹,*,*,*,*,素敵,ステキ,ステキ
な      助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ
1       名詞,数,*,*,*,*,*
日      名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ
に      助詞,格助詞,一般,*,*,*,に,ニ,ニ
なり    動詞,自立,*,*,五段・ラ行,連用形,なる,ナリ,ナリ
ます    助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
よ      助詞,終助詞,*,*,*,*,よ,ヨ,ヨ
ウニ    名詞,一般,*,*,*,*,ウニ,ウニ,ウニ
😘😚    記号,一般,*,*,*,*,*
(      記号,括弧開,*,*,*,*,(,(,(
笑      名詞,固有名詞,人名,名,*,*,笑,エミ,エミ
)      記号,括弧閉,*,*,*,*,),),)
(^      名詞,サ変接続,*,*,*,*,*
o       名詞,一般,*,*,*,*,*
^)      名詞,サ変接続,*,*,*,*,*
EOS

上記の例で助詞と助動詞に挿入するとこうなる。

Before:

章恵ちゃん、オハヨー😃😃✋❗章恵ちゃんにとって素敵な1日になりますよウニ😘😚(笑)(^o^)

After:

章恵ちゃん、オハヨー😃😃✋❗章恵ちゃんにとって、素敵な、1日に、なります、よ、ウニ😘😚(笑)(^o^)

助動詞の場合、形容動詞も動詞も連体形では自然な傾向がある気がする(例:「素敵な1日」→「素敵な、1日」)。
当然のごとく体言が連なるので、一息つくには悪くないタイミング。
一方で、直感的には終止形のものに挿入しても良さそうだが、実際は割と違和感ある。(例:「なりますように」→「なります、ように」)。また、動詞で未然形、連用形に使われる助動詞(ない、ます)の後も、不自然になりやすい傾向がある気がしている。

助詞でも格助詞や接続助詞なら自然だが、無理に終助詞に挿入を試みると違和感が。。
下手に挿入するよりも、名詞のあとにいれたほうが無難な可能性もあるが、上記の例にあるように顔文字の部品などは形態素解析上は名詞扱いされることがしばしばあるのでその戦略も採りづらい。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions