読者です 読者をやめる 読者になる 読者になる

時の最果て

書籍や読書に関する情報を紹介します

書評 『ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム』

皆様は、テキストマイニング自然言語処理という言葉を聞いたことがありますでしょうか。

いずれも人間同士が日常に使う言語をコンピュータに読解させる技術です。
読解の目的は、人間と同様で様々です。

  • 文章のキーワードを把握する
  • 文章同士や単語同士が似ているか判定する
  • 文章を要約する

などなど、他にもたくさんあります。

そして、ご存知の方も多いかと思いますが、すでに世の中のサービスでその技術は活用されています。
例えば、

  • Yahoo!Googleなどの検索エンジンで目的のウェブサイトが表示される
  • ニュースサイトで関連や似たニュース記事が推薦される

などなど、実はいろんなサービスで活用されています。
最近は、自然言語処理が活用された取り組みがやや拡大解釈されAIと言われ日々新聞などを賑わしています。

今回は、自然言語処理の割りと珍しい応用法を紹介した書籍『ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム』を紹介します。
ズバリ!タイトルどおり、売れる小説をコンピュータに判定させようというかなり面白い取り組みです。

是非読んでいただきたいです。

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

自然言語処理の手法などには全く詳しく触れず、この分野に不案内な方でも非常に読みやすい内容になっています。 「なるほど最近はITを活用してこんな事もできるのか!」と気楽な気持ちで読み進めていけばよいかと思います。

さて、果たしてコンピュータにそんなことができるのか、という感じがしますが、
結論としては、約80%の確率で売れる小説とそうでないものを判定できたそうです。

まぁ、感覚的に一定のパターンはありそうですので、自分としてはそこまで意外な話ではないですが。

さて、それでは内容を少し紹介したいと思います。

書くテーマによって売れる売れないが決まる!?

小説が何について書かれているかを分析すると一定のパターンがあると筆者は述べています。

  • 約3分の1は、特定の1テーマについて書かれている
  • 日常的・現実的なテーマを扱っている

前者について、
ベストセラー小説はその内容の3分の1を一つないしは二つのテーマについて書いているそうです。 そして残りの3分の2は、それとは別のテーマを書く傾向にあるとのことです。 逆に売れない小説は、複数のテーマを詰め込む傾向があるそうです。

後者について、
売れる作家は「結婚」「死」「税金」といったリアリズムを感じさせるテーマを選ぶそうですが、売れない作家は宇宙戦争などの非現実的なテーマを選びがちだということです。非現実がからならずしも売れないわけではないですが、困難さが増すようです。

つまり、売れる小説は少数の現実的なテーマにフォーカスしている傾向が強いようです。

ちなみに、この分析に使われた手法はトピック分析と言って非常に面白い手法です。
興味がある方は少し調べてみてください!

女性作家のほうが売れやすい文体!?

もう一つの特徴として文体が挙げられています。
文体は、具体的に言いますと、利用する単語の頻度や句読点の頻度などで評価しているようです。

そして売れる文体の特徴を持つベストセラーをランキングすると女性作家が上位を占めたそうです。 これについて著者は、売れる文体の特徴は「普通の人が理解できる言葉や文章」であり、あくまで一般的に女性にその能力が高いと考察しています。
また、その理由としては、英文学の世界が男性優位社会であるため、そこで活躍できなかった女性がジャーナリズムの世界でものを書くことを学んだためだと述べています。

この他にも、ストーリの感情の変化を分析して一定の売れるパターンを発見したり、よく使われる動詞を分析してキャラクターの特徴のパターンを見つけたりととても興味深い内容です。
是非読んで頂きたいです! (ちなみに、感嘆詞の多用は売れない傾向にあるらしいです・・・)

本書の難点を唯一挙げるとすれば、本文中に出てくる小説が当然アメリカのものなので日本人にはいまいち例としてピンとこないと言う点でしょうか(笑)。
まぁ、これは別に本書が悪いわけではないですね。アメリカの小説をよく読んでいる人はより理解し易いのかもしれません。

こんな方にオススメ

最後に、本書を特にオススメしてみたい方とその理由を書きます。

  • 出版社の方

AIによって将来仕事がなくなる職業などがよく話題になりますが、本書の技術が成熟すると編集者の方には脅威になるかもしれません。

もちろん機械が簡単に成り代われるものではないでしょうが、昨今経験やカン、直感などが重要視されてきた分野でデータによるコンピュータの判断のほうが上回る事例が多くなってきています。

今のコンピュータがどのレベルまで来ているか知るために良い一冊かと思います。

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム