大学模擬授業①（福岡工業大学　馬場謙介教授）

令和７年11月12日（水）、本校１年生が、高大連携をしている法政大学と福岡工業大学による大学模擬授業を受講しました。

福岡工業大学は「オンライン」で法政大学は「対面」で講義をいただきました。

一つ目の講義は、福岡工業大学情報工学部情報工学科　馬場謙介教授の「情報検索」です。

情報検索は、インターネットでの検索をはじめとして生活の様々な場面で活用されている技術です。

コンピュータの発達と普及によって膨大なデータが扱えるようになり、そこから目的の情報を効率的かつ正確に見つけることが求められています。

配列やリストなどのデータ構造の中から目的のデータを探した出すことを「探索」といいます。

例えばデータ数が100億ある中から１つを探し出すといった場合、いかに効率よく速く探すかということが重要になってきます。

探索のアルゴリズムとして、以下の３つをご紹介いただきました。

「線形探索」

配列の先頭から順番に目的のデータかどうかを調べていく方法です。

しらみつぶしに探していく最も単純なアルゴリズムです。

データがｎ個ある場合の探索回数は、

最も早い場合は先頭に目的のデータがあるときで1回、最も遅い場合は最後尾に目的のデータがある場合でn回となります。

「２分探索」

目的のデータとの大小を比べることでデータを探し出すアルゴリズムが２分探索です。

例えば、ある人の誕生日がいつかということに対して、〇月より前か後か、〇日より前か後かという作業を繰り返して、該当の日に近づいていくというものです。

データの大小を利用して探すので、あらかじめデータが小さい順（昇順）もしくは大きい順（降順）にソートしておく必要があります。

「ハッシュ検索」

ハッシュ探索法は、何かしらの計算式を用いて格納先を決めて格納する探索方法です。

この「何かしらの計算式」を計算する関数のことをハッシュ関数と呼びます。

馬場教授１

上の図の例では、「数字を７で割った余り」で格納先を７個（０から６まで）作っています。

ハッシュテーブルは専用の計算式からデータの格納先がわかるため、原則探索回数1回でデータを見つけ出すことができるという優れものです。

ただし、いつもうまくいくとは限らず、格納しようとした場所にすでにデータが存在し、衝突してしまうことがあります。

衝突してしまった場合の対策の一つとして、画面のように重複したデータをリストでつなげていくというやり方があります。

さらに「二つの対象の類似度を測る検索」方法についても学びました。

「ジャッカード係数」は、二つの集合の類似度を測るための指標で、共通部分の大きさを和集合の大きさで割って計算します。値は０から１の間を取り、１に近いほど類似度が高く、０に近いほど類似度が低いことを意味します。この係数は、テキスト分析などで広く利用されます。

馬場教授２

俳句コンテストの俳句の盗作を見つけるのにこの係数が応用されています。

係数が0.5より大きいとひっかかるそうです。

ただこれは文字列の近さだけなので、さらにＡＩを使えば、俳句に読まれている情景の近さも読めるそうです！

馬場教授３

このような情報検索技術を応用して、福岡工大では学生がＡＩ俳句アプリを開発しました。

高齢者向けの俳句のチャットポッドで、詠んだ一句に対してＡＩが感想をいってくれるものです。話し相手にもなってくれます。

馬場教授は「勉強して技術を応用して実社会で活用できるものを生み出してほしい」とおっしゃられていました。

最後に質問時間がありましたが、

「俳句の盗作検索システムは、実際には盗作ではなくてもひっかかることがあるので、審査の補助として検索アルゴリズムを使っている。」

「ＡＩが今後どうなっていくか。チャットＧＰＴは感情を持っているわけではない。人間のような意識を持つものが誕生するのはまだ大分先になるのではないか。」

などの議論が活発になされました。

「教授のお誕生日はいつですか」という質問に対しても、やさしく今日習った「二分検索」の方法で教えてくださいました！

馬場教授、ご講義ありがとうございました！

二つ目の講義の記事に続きます。