たくなくの雑記帳

思ったことを書き留める雑記帳

Amazonの検索結果を絞り込みたい人

年に2回くらい使いそうなのでメモがてら調べたことを残す。

Amazonセールだ!

f:id:valuask7:20211123123228p:plain

いつもお世話になってます

今年も年末商戦期になり、各社恒例となったブラックフライデーセールを展開しています。

Amazonも例にもれず11/26からブラックフライデーセールを開催しますが、先だってKindleのセールが開始されたようです。

f:id:valuask7:20211123105342p:plain

Kindle BLACK FRIDAYセール(~12/2)

中でも、黒(96)にかけた96円セールはなかなかの価格破壊で、何かお宝が発見できればいいなといろいろ見ていました。

 

多いですねAmazon先生...

というわけでこちらをご覧ください。

f:id:valuask7:20211123105634p:plain

その総量、400ページ

そうそうドラゴン桜、面白いですよね。僕も受験生の頃は...っていう話ではなくて、ページ数のところをご覧ください。

 

そう、400ページ。

 

さすがに多いですね。いかに掘り出し物を探したくても、400ページ吟味する間にブログの1本でも書いたほうが建設的です。(そして今実際そうなっている)

なので、400ページ見る前に、もう少し絞り込むことができないか調べてみます。

絞り込み検索をしたい

あまり知られていませんが、Amazonでは通常のヒットさせる検索に加え、ヒットさせない絞り込み検索ができます。 

通常は「ヒットさせたいキーワード」を入力しますが、半角ハイフンで区切ると「ヒットさせたくないキーワード」を指定することができます。

 

したがって、

とすると、漫画が除外されます。

どこで絞り込んでいるのか?

もう少し実験してみますが、こちらのパターンでは漫画が除外されません。むむ。

具体的なAmazonの検索仕様がわからないので何とも言えませんが、この検索では商品名のほかに、売れ筋ランキングのカテゴリを対象にとっているようです。

 

例えば、ドラゴン桜(1)を例にとると、この本は

登録情報
ASIN‏ : B091PWQZM3
出版社‏ : コルク (2021/4/9)
発売日‏ : 2021/4/9
言語‏ : 日本語
ファイルサイズ‏ : 306585 KB
Text-to-Speech(テキスト読み上げ機能)‏ : 有効になっていません。
X-Ray‏ : 有効にされていません
Word Wise‏ : 有効にされていません
Amazon 売れ筋ランキング :
- 2位メディアミックスマンガ
カスタマーレビュー: 5つ星のうち4.4    415個の評価

という登録情報を持ちますが、ここの「メディアミックスマンガ」に「-マンガ」の除外が効いているように見えます。

 

また別に、ゆるキャン△(1)を見てみると、

登録情報
ASIN : B01853H0C4
出版社 : 芳文社 (2015/11/12)
発売日 : 2015/11/12
言語 : 日本語
ファイルサイズ : 102052 KB
Text-to-Speech(テキスト読み上げ機能) : 有効になっていません。
X-Ray : 有効にされていません
Word Wise : 有効にされていません
本の長さ : 182ページ
Amazon 売れ筋ランキング :
- 2位4コマまんが
- 52位コミック
カスタマーレビュー : 5つ星のうち4.7    1,534個の評価

となっているためか、こちらは「-マンガ」「-コミック」のいずれでも除外ができました。

「-マンガ」の絞り込み表現が「4コマまんが」に効くというのは結構大きな収穫です。

  • 絞り込みはAmazon売れ筋ランキングのカテゴリに作用する
  • 絞り込みは単語レベルで作用する
  • ひらがな/カタカナは区別しない
  • (当たり前だが)ひらがな/漢字は区別する

しかし不具合らしきものも...

とはいえ、明快な挙動ばかりが見つかったわけではなく、理解に苦しむものもありました。

セール対象の中には、Kindle Unlimitedでよく配信されているような海千山千なタレント写真集があり、ランキングカテゴリの表記としても存在しているんですが、「タレント写真集」で除外しようとするとなぜか「アダルト写真集」のカテゴリがストレートにヒットする謎挙動がありました。

ユーザ視点では間違いなく不具合ではありますが、検索アルゴリズム的には実は正しい、みたいな隠れパラメータのようなものが実はあるのかもしれません。

このあたりも色々試したことで、

  • 検索キーワード:-タレント写真集
    • 結果:ダメ
  • 検索キーワード:-タレント -写真集
    • 結果:ダメ
  • 検索キーワード:-写真集 -タレント
    • 結果:よさそう

という挙動になることがわかりました。

大まかな挙動としては絞り込み検索はOR検索で記載順序に影響しないような印象がありましたが、2つ目と3つ目の違いから、キーワードの指定順序も影響があることがわかります。
確かに、SEOの世界でもキーワード順序で検索結果を変えている話はよく出るので、それ自体は驚くことではないのですが、今回のケースはこういう挙動にしている意図がよくわからない感じですね。(とはいえこれは単に副次的な産物のような気がします)

日本語に反応する検索エンジンを整備するにあたっては、日本語の形態素解析なんかもやっていると思いますが、「タレント写真集」みたいな複合語よりも「タレント」「写真集」で明確に区切ってあげたほうがこちらの意図に適いやすい結果が得られそうです。

気を取り直して絞り込もう

少し謎の挙動もありましたが、絞り込み検索の動きは大分よくわかってきました。ここから改めて、96円セールの400ページを絞り込んでいきたいと思います。

目標としては、

「マンガや雑誌を除いた、ビジネスや自己啓発本のセール対象品」

です。

 

これを念頭にいろいろやって、とりあえずここまできました。

f:id:valuask7:20211123114745p:plain

144ページまで減った

144ページです。まずまずですがまだ多いですね。

Kindle Unlimited対象を除外したい

検索結果をざっと見ていると、結構な数のKindle Unlimited対象が含まれていることがわかります。

f:id:valuask7:20211123115008p:plain

体感的に半分くらいKindle Unlimited

僕はKindle Unlimitedに加入しているので、何もこの96円セールのタイミングでKindle Unlimited本を漁る必要はありません。
(あとKindle Unlimited本は経験的にピカイチの良書が少ない)

したがって、このKindle Unlimitedもまとめて除外してしまいたいところです。

しかしどうやらだめらしい

色々調べてはいたんですが、どうもKindle Unlimited対象を除外することはできなさそうです。

Kindle Unlimited対象だけを表示することは簡単なんですけどね...。

 

残念ですが基本的な絞り込みアプローチは最初に発見した絞り込み検索1本で戦っていくことになりそうです。

もしどなたか、「Kindle Unlimitedの除外」をご存じでしたらぜひ教えてください。

最終的にこうなった

Kindle Unlimited除外がだめだったので、結局キーワード絞り込みとカスタマーレビュー絞り込みで対応することにしました。

f:id:valuask7:20211123125243p:plain

28ページならなんとか...

28ページまで減りました。まぁこんなところでしょう。

その他、検索クエリ一覧

今回は使いませんでしたが、URLに直打ちするタイプの検索クエリはいくつかあったので備忘がてら書き残しておきます。

クエリ対象 クエリ例 挙動
出品者 &emi=AN1VRQENFRJN5 Amazon公式の商品のみになる
割引率 &pct-off=80- 80%以上の割引率がある商品のみになる
価格帯 &low-price=1000&high-price=5000 1000円以上5000円以下の商品のみになる
カスタマーレビュー &ref=sr_nr_p_72_1 カスタマーレビューが★★★★☆以上の商品のみになる

カスタマーレビューの条件だけはやや表現が特殊で、

  • sr_nr_p_72_1:★★★★☆以上
  • sr_nr_p_72_2:★★★☆☆以上
  • sr_nr_p_72_3:★★☆☆☆以上
  • sr_nr_p_72_4:★☆☆☆☆以上

って関係になってました。

出品者を絞るやつは怪しい中華アイテムを除外するのにいいということで話題になっていましたね。

それ以外の属性は?

Amazonの検索URLには上記以外のパラメータ( "&" で区切られたキーワード)も色々ありますが、特段仕様として公開されているものでもないため、大部分は不明です。

しかし、一部は解読(?)されているようで、以下のページなんかにその調査記録がありました。

よくわからないものも多いですが、timestampであるqidが

(1)著者・販売者が Amazon にログインする、あるいは自社の IP アドレスから Amazon に接続する。
(2)その状態で自分の商品を検索して、ある時刻の qid を含む商品ページの URL を生成する。
(3)その URL を知人に教えたり、ブログに掲載したりする。
(4)その URL を踏んだ誰かが、そのままログインして、その商品にレビューを投稿する。
(5)レビュー投稿者と著者・販売者の関係が疑われ、Amazon はレビューを削除する。

として機能しているのは興味深かったですね。

最近Cookieなんかでユーザ情報を取得するのが厳しいご時世ですが、URLパラメータなども活用しながらあの手この手でユーザ行動を類推、予測しようとする企業努力を垣間見た気がしました。

 

まとめ

というわけで今回は膨大なAmazonセール対象からお目当ての商品を発見すべく、検索結果の絞り込みについて調べてみました。

お分かりかと思いますが、肝心のセール品物色はこれを書いている1時間あまりの間、一向に進んでいません😇

 

 

にほんブログ村 にほんブログ村へ
お読みいただきありがとうございました!
応援クリックよろしくおねがいします!