公開日:

吉積情報WEB

【検証】不揃いな顧客リストをGeminiでクレンジング!表記ゆれや重複データをどこまで自動で整形できるか試してみた

【検証】不揃いな顧客リストをGeminiでクレンジング!表記ゆれや重複データをどこまで自動で整形できるか試してみたサムネイル画像

「同じ企業名なのに"株式会社"と"(株)"が混在している」「同一人物が重複登録されており、正確な顧客数が把握できない」――。多くの企業で、こうした顧客リストの不備が営業効率や分析精度を低下させる原因となっています。

この「データクレンジング」と呼ばれる地道な手作業に、毎月多くの時間を費やしている方も多いのではないでしょうか。もしこの作業を自動化できたら、どれほど効率化できるだろう、と考えたことがある方も少なくないはずです。

本記事では、その課題を解決する一手として、GoogleスプレッドシートのAI機能「Gemini」がどこまで活用できるのかを、実際のデータを用いて具体的に検証します。

※Gemini in スプレッドシートを実行するタイミングによっては、日本語プロンプトに対応しない場合があります。その場合は、英語に変換して再度実行してみましょう。

顧客リストにおける表記ゆれと重複データが生むリスク

まずは、顧客リストにおける表記ゆれと重複データが生むリスクについて、以下を説明します。

  • 営業活動の機会損失
  • 分析精度の低下
  • 顧客満足度の低下

営業活動の機会損失

顧客リストの表記ゆれや重複データは、営業活動における大きな機会損失につながります。

例えば「吉積情報株式会社」と「吉積情報(株)」が別々の企業として登録されていると、本来ひとつにまとまるはずの顧客情報が分断され、対応履歴が散在してしまいます。その結果、営業担当者は過去のやり取りを正しく把握できず、顧客ニーズに沿った提案やフォローを逃してしまう恐れがあります。さらに、重複登録された顧客に複数の営業担当が同時にアプローチしてしまうと、社内のリソースが無駄になるだけでなく、顧客から「何度も同じことを聞かれる」と不信感を持たれるリスクも生じます。

データの乱れは受注機会を逃す原因となり、結果的に営業成果を大きく損ねかねません。

分析精度の低下

顧客リストに表記ゆれや重複データが含まれていると、数値分析や効果測定の際に大きな誤差を生み出す可能性が高いです。例えば、同一顧客が複数企業としてカウントされれば、実際よりも顧客数や取引件数が多く算出されてしまいます。その結果、施策の成果が過大評価される、あるいはターゲット層の実態が見えにくくなるといった問題が発生するでしょう。

また、営業活動の進捗管理や売上予測にも影響し、正確性を欠いたデータは意思決定を誤らせるリスクも高めます。顧客データは経営判断に欠かせない資産ですが、正確な内容でないと投資配分や人員配置といった戦略全体にも悪影響を及ぼしかねません。表記ゆれや重複は信頼性を損なう要因となり、分析精度を低下させてしまうのです。

顧客満足度の低下

顧客リストが表記ゆれや重複のまま管理されていると、企業の対応に一貫性が失われます。例えば、同じ顧客が部署ごとに異なる表記で登録されていると、営業部とサポート部で別顧客として扱われ、顧客は「部署ごとに対応がバラバラで、同じ要望を何度も伝えなければならない」と感じてしまいます。その結果、問い合わせや要望が正しく共有されず、二度手間をかけさせることで不満や不信感を招くリスクが高まります。

特に長期的な関係構築が欠かせないBtoB取引においては、対応の一貫性こそが土台となります。もしデータ管理の不備によって顧客体験が損なわれれば、取引継続の意欲が揺らぎ、競合他社への切り替えにつながる可能性も否定できません。

顧客データをGeminiで自動クレンジングしてみよう!

それでは、さっそく顧客データをGeminiで自動クレンジングしてみましょう。まずは準備として、クレンジング前の「Before」のイメージと、「こんなふうに整えたい」という手動で補正した「After」のイメージからご紹介します。

  • 【検証①】従来通り手動クレンジングをやってみた〈表記ゆれ補正・重複データ削除〉
  • 【検証②】Geminiで自動クレンジングをやってみた〈表記ゆれ補正〉
  • 【検証③-1】Geminiで自動クレンジングをやってみた〈重複データ削除〉
  • 【検証③-2】表記ゆれ補正後のデータを使用した、重複データ削除はどうなるか

 

【検証①】従来通り手動クレンジングをやってみた〈表記ゆれ補正・重複データ削除〉

【Before】元データを確認:クレンジング前の顧客リスト

今回の検証で使用する顧客リストは、スプレッドシートで作成しました。
spreadsheet-gemini_1

項目ごとの表記揺れ内容は以下の通りです。

項目

表記揺れ有無

表記揺れの内容

企業ID

・全角数字

・半角数字

企業名

・「株式会社」

・(株)(全角カッコ)

・(株)(半角カッコ)

部門

・正しい部署名

・不明

担当者名

-(表記ゆれなし)

郵便番号

-(表記ゆれなし)

住所

・ビル名有

・ビル名無

・番地全角・

・番地半角

メール
アドレス

・正しいアドレス

・空欄

 

【After】手作業でのデータクレンジングの場合

こちらは、手動で補正したAfterイメージです。

手動で表記揺れ補正した結果spreadsheet-gemini_2

表記揺れをなくすと、赤・黄色・緑で色付けした行の内容が全て同じになります。(わかりやすいよう同じ行は手動で色付けしています)

手動で重複データを削除した結果

そして、表記揺れした表に対して、手動で重複データを削除したイメージがこちらになります。

spreadsheet-gemini_3

表記揺れ・重複データ削除をすると、結果3行のデータになります。

手動で補正すると上記のようになりますが、果たしてGeminiを使うとどこまで自動でクレンジングできるのでしょうか。気になりますよね。

では、実際に検証してみましょう。

【検証②】Geminiで自動クレンジングをやってみた〈表記ゆれ補正〉

それでは、実際に検証してみます。まずは、Gemini in スプレッドシートを使って表記ゆれの補正を行ってみましょう。

【Before】元データを確認:クレンジング前の顧客リスト

今回も、手動クレンジングと同様の顧客リストデータを使用します。

spreadsheet-gemini_1

 

サイドバーのプロンプト欄に「このスプレッドシートの表に、表記ゆれが含まれています。補正した内容の表を生成してください。」と入力し、実行してみましょう。

spreadsheet-gemini_4

 

表記揺れが補正された表がスプレッドシート内に生成されました。

spreadsheet-gemini_5

 

補正内容が正しいかどうか、ひとつひとつの項目を人の目で確認していきます。

spreadsheet-gemini_6

 

チェック結果

項目

修正前

修正後

結果

企業ID

・全角数字

・半角数字

半角数字に統一

企業名

・「株式会社」

・(株)(全角カッコ)

・(株)(半角カッコ)

「株式会社」に統一

部門

・正しい部署名

・不明

・正しい部署名

・不明

△(プルダウンで選べる)

住所

・ビル名有

・ビル名無

・番地全角・

・番地半角

・ビル名有

メール
アドレス

・正しいアドレス

・空欄

・正しいアドレス

・空欄

△(修正なし)

 

企業ID・企業名・住所は補正されました。部門名については「不明」と表示されたままのものもありましたが、プルダウンで部門名を選択できる形式に整えられています。メールアドレスについては、空欄だったものは特に補正されていませんでした。

【After】Geminiでの自動データクレンジングの場合〈表記ゆれ補正〉

まとめると、Geminiで表記ゆれを補正した結果は、以下のとおりです。

Before:

spreadsheet-gemini_1

 

After:

spreadsheet-gemini_6

 

【検証③-1】Geminiで自動クレンジングをやってみた〈重複データ削除〉

検証②を踏まえて、今度はデータの表記ゆれ補正、重複データの削除までをそれではGemini in スプレッドシートの機能を使って重複データ削除を行ってみます。

検証③-1:元のデータから直接削除する

まずは、こちらも前回同様何も補正されていない、こちらの顧客リストデータを使用します。Beforeのデータを使って実施してみます。

Before:

spreadsheet-gemini_1

 

プロンプトに「このスプレッドシートの表に重複データが含まれています。修正した表を生成してください。」を入力して実行します。

spreadsheet-gemini_7

 

実行結果の表は以下の通りです。

spreadsheet-gemini_8

 

「吉積情報株式会社」「吉積情報(株)」「吉積情報」「ヨシヅミ」はすべて同じ会社として認識され、1行に統合されました。部門名については「営業部」「総務部」「不明」が1つのセル内にまとめて表示されています。また、担当者名やメールアドレスなど、同じ企業に属するものは、1つのセルに整理されていることがわかります。

Geminiで重複データを補正した結果はこちらです。

After:

spreadsheet-gemini_9

 

【検証③-2】2️⃣表記ゆれ補正後のデータを使用した、重複データ削除はどうなるか

続いて、表記ゆれを修正した後のデータを使い、プロンプトに「このスプレッドシートの表に重複データが含まれています。完全一致する行をまとめて、統一された表を生成してください。」と入力し、実行してみましょう。

Before:

spreadsheet-gemini_6

 

After:

spreadsheet-gemini_12

表記ゆれを修正したデータに対して重複削除の指示を出したところ、上記のようにデータが整いました。部門名が「不明」となっているものはそのまま残り、メールアドレスが空欄だったものには、なぜか「nan」と入力されていますね。

このように、表記ゆれや単純な重複データであれば、Geminiを使うことで高精度に整形できることがわかりました。手作業で一つひとつ修正するのに比べ、工数を大幅に削減できることも確認できました。一方で、複雑な判定ルールやケースごとの判断については、人による最終確認が欠かせません。

検証結果から見るGemini活用のポイントと注意点

今回の検証から、Geminiは表記ゆれや単純な重複データのクレンジングにおいて、非常に高い精度で作業を自動化できることが分かりました。

  • 得意なこと: 「(株)」と「株式会社」の統一、全角・半角の統一、住所表記の整形など、ルールが明確な表記ゆれの補正。
  • 注意が必要なこと: 「不明」とされたデータの補完や、空欄へのデータ追記など、元データにない情報を推測・補完する作業は完全ではありませんでした。また、「nan」のような意図しない出力がされるケースもあり、最終的な人の目による確認は不可欠です。

ビジネスにおけるインパクト

これまで担当者が数時間かけていた手作業の多くを、Geminiは数十秒で完了させます。これにより、担当者は単純作業から解放され、より戦略的な営業リストの分析や、マーケティング施策の立案といったコア業務に集中できるようになります。

データクレンジングの工数を大幅に削減しつつ、データの精度を高めることで、営業機会の損失を防ぎ、データに基づいた正確な意思決定を実現できるでしょう。

 

Google Workspaceとの組み合わせで広がる活用シーン

ここからは、Google Workspaceとの組み合わせで広がる活用シーンを紹介します。

  • データの生成
  • 数式・関数の生成
  • 要約
  • データ分類

データの生成

Google Workspaceを利用すれば、スプレッドシート上でGemini(Gemini in スプレッドシート)を活用でき、ゼロからデータ表を自動生成することが可能です。これまでのように「列を作成し、セルに入力し、体裁を整える」といった地道な作業は不要になります。例えば「売上管理表を作りたい」「社員ごとの勤怠表を作成して」と指示するだけで、適切な列名やフォーマットを備えた表が瞬時に完成するのです。

さらに、Googleドライブに保存して共有すれば、生成後すぐにチームメンバーと同時編集も可能です。つまり、表作成にかかる時間を大幅に削減できるだけでなく、データをチーム全体で効率的に活用できる基盤を整えられます。その結果、担当者は「表を作る作業」ではなく「データを活かす業務」に集中でき、業務全体の生産性向上につながります。

数式・関数の生成

複雑な数式や関数も、Gemini in スプレッドシートを使い、自然な言葉で指示するだけで自動生成できます。例えば「売上リストから月ごとの合計を出したい」「条件を満たすデータだけ抽出したい」と伝えると、適切な関数が自動で作成され、すぐに活用できます。

これまで数式に不慣れな担当者はマニュアルを見ながら試行錯誤する必要がありましたが、その負担を大幅に減らせるでしょう。さらに、一度生成した関数はチームで共有できるため、ナレッジの蓄積にもつながります。

「関数が使えず業務が止まる」といった属人化のリスクを防ぎ、より多くの社員がスプレッドシートを活用できる環境を実現できます。

要約

大量のデータや文章をまとめたスプレッドシートも、Gemini in スプレッドシートを使えば瞬時に要約できます。例えば、アンケートの自由回答を集計した場合、従来は担当者が一つひとつ目を通して傾向を整理する必要がありました。しかし、Geminiに「このデータの傾向を要約して」と依頼すれば、簡単に内容を理解でき、共通する課題を短時間で抽出できます。

Googleドキュメントやスライドにコピーすれば、要約結果をすぐに報告資料へ反映することも可能です。

Gemini in スプレッドシートを使えば情報収集から報告までの業務プロセスのスピードがアップし、意思決定の迅速化につながります。担当者は付加価値の高い業務に専念できるようになるでしょう。

データ分類

スプレッドシートに蓄積されたデータを、特定の条件に基づいて自動で分類できるのも、Gemini in スプレッドシートの強みです。例えば、顧客リストを「新規」「リピーター」「休眠顧客」といった属性ごとに振り分けたり、商品レビューを「ポジティブ」「ネガティブ」「中立」に分類したりといった作業が、わずか数秒で完了します。

従来はフィルタ機能や関数を駆使して何度も試行錯誤する必要がありましたが、Geminiに自然な言葉で依頼するだけで精度の高い分類が可能です。

関連記事:【基本編】Google スプレッドシート(Spread Sheets)の使い方・共有方法・便利機能を紹介

関連記事:【応用編】Googleスプレッドシート(Spread Sheets)の活用方法・機能を紹介

顧客リストの整備はGeminiにどこまで任せられるか

本記事では、GoogleスプレッドシートのAI機能「Gemini」を使って、不揃いな顧客リストのクレンジング精度を検証しました。

その結果、表記ゆれや単純な重複データであれば高精度で自動化でき、手作業の大幅な削減につながることを確認できました。一方で、複雑な判定ルールやケースごとの判断は、やはり人による最終確認が欠かせないことがわかりました。つまり「すべてをGeminiに任せられるわけではない」が、「手作業に比べて工数を劇的に削減できる」点は、大きなメリットであり、生産性を高めるための強力な一手になるといえるでしょう。

ぜひ、本記事で紹介したプロンプトを実際に試してみたり、まずは少量のデータで検証してみることをおすすめします。データ整備の新しい形をぜひ模索してみてください。吉積情報では、Googleの生成AI「Gemini」の導入・定着・活用支援プログラム「AI Driven」や、Google Workspaceの導入支援を行っています。

専門家のアドバイスや支援を受けて導入・活用をお考えの方、ぜひお気軽にお問い合わせください。

お問い合わせ・ご相談はこちら

吉積情報WEB
吉積情報WEB
吉積情報株式会社WEB担当チーム、コラボラボではGoogle Workspaceに関するブログ記事を掲載しています。
データはすべてドライブへ!Google ドライブ運用まるわかりセミナー

14:00-15:00 オンライン

データはすべてドライブへ!Google ドライブ運用まるわかりセミナー

詳細はこちら

Google Workspace vs. Microsoft 365 徹底比較! ~ Gemini で加速する生成AI時代の働き方~

14:00-15:00 オンライン

Google Workspace vs. Microsoft 365 徹底比較! ~ Gemini で加速する生成AI時代の働き方~

詳細はこちら

非エンジニア歓迎!基礎から活用シーンまで学べる! AppSheet を使った現場 DX 入門セミナー

14:00-15:00 オンライン

非エンジニア歓迎!基礎から活用シーンまで学べる! AppSheet を使った現場 DX 入門セミナー

詳細はこちら

Gemini と NotebookLM でビジネスを加速! ~ Google Workspace との連携で実現する、生産性向上と DX 推進~

14:00-15:00 オンライン

Gemini と NotebookLM でビジネスを加速! ~ Google Workspace との連携で実現する、生産性向上と DX 推進~

詳細はこちら

【Microsoft 365ユーザー必見!】仕事が変わる!実践型Google Workspace×Gemini徹底解説

14:00-15:00 オンライン

【Microsoft 365ユーザー必見!】仕事が変わる!実践型Google Workspace×Gemini徹底解説

詳細はこちら

オンラインセミナー開催中

お申込みはこちらをCheck!

関連する他の記事をよむ