先日、こちらのニュースでお知らせいたしました通り、Kaggle Grandmaster小嵜が「Computer Vision and Pattern Recognition Conference 2023(以下:CVPR)」のワークショップに登壇し、先日無事帰国いたしました。
今回は、現地の開催内容や小嵜のコメントをレポートにまとめてご紹介します。
概要
CVPRは、コンピュータービジョン分野で最も権威のある国際会議の一つです。世界中から最新論文の知見や優秀な技術者が集まり、ワークショップを通じた意見交換や論文発表などを行います。
2023年は6月18日〜22日(現地時間)にカナダのバンクーバーで開催されました。
開催期間中は、2日間のワークショップとチュートリアル、3日間のメインカンファレンス(論文発表)などが行われました。
1日目、2日目
CVPR最初の2日間は、コンピュータービジョン分野に関連するワークショップ・チュートリアルが行われました。ワークショップ・チュートリアルは2日間を通じて100項目近くあり、会場内の各発表エリアに分かれて開催されました。
小嵜:私のワークショップへの登壇は2日目だったので、1日目は興味のある分野のワークショップをいくつか選んで聴講しました。Ristでの仕事にも関連する、外観検査を研究テーマとして扱ったワークショップのほか、イメージマッチングや異常検知をテーマとしたワークショップも聴講しました。
2日目は、午前中に行われた「Image Matching: Local Features & Beyond」のワークショップ に登壇しました。「Image Matching: Local Features & Beyond」は、画像と画像のマッチングをテーマにしたワークショップです。アプリケーションを使用し、2次元の画像から3次元のシーンを再現するというテーマについて、さまざまな研究内容が発表されました。
このワークショップの主催者がKaggleでコンペティションを開催しており、私はそのコンペティションで上位入賞したため、招待を受けてソリューションの発表を行いました。私以外にも上位入賞者によるソリューション紹介の時間があり、コンペティション優勝者のソリューションについては参加者との質疑応答が交わされるシーンもありました。
Kaggleコンペティションの詳細はこちら
3日目〜5日目
後半の3日間は、論文発表の場であるメインカンファレンスが行われました。
今年のCVPRには9,155件の論文が投稿され、その中から2,359件が採択されました。CVPRの論文投稿数・採択数は年々増え続けており、今年は過去最多の件数でした。
小嵜:今年のメインカンファレンスにおけるプログラムの大きな特徴は、口頭発表 (Oral Session) が無い点でした。口頭発表は往々にして並列でスケジュールが組まれるため、興味のある発表をすべて聞くことができないという弱点がありました。今年は Award candidates(受賞候補者) だけ口頭発表を行い、残りのほとんどは、全ての内容をポスター発表で行う試みがなされていました。残念ながら、今年はカナダのビザを取得できない発表者が多く出ており、発表者不在のポスターも目立っていました。
全体の傾向として、CLIPモデルを活用した画像タスクと自然言語処理を統合する研究内容が非常に多く発表されていることに驚きました。Rist が行っている外観検査AI の開発に関連付けるならば、異常検知の文脈では異常画像が多く手に入らないという場面が多々あるため、WinCLIP の発表にあるように言語によって異常を定義して異常画像を検知する方法は参考になりました。
先立って実施された WAND ワークショップ (https://sites.google.com/view/vand-cvpr23/home) では 、WinCLIP をベースラインとした外観検査タスクのコンテストが開催されており、中間層の情報を活用するなどの細かなアイディアが共有されていました。
あとは、NeRF関連の論文をはじめとした3Dモデルを扱った研究も多く見られました。カメラの軌跡を復元することでモーションブラーや不正確なカメラ姿勢を調整する BAD-NeRF や、 Few-shot レンダリングのためにシンプルな周波数範囲の正則化を導入する FreeNeRF など、様々な工夫が発表されていました。
2時間ごとに約400件、3日間で約2300件あるポスター発表の中から自分が聞きたいテーマを探し、限られた時間内で効率よく発表を聞いてまわる必要があったので、広い会場を1日中歩き回りました。ちなみに1日あたりの万歩計の数値は15,000歩を超えました(笑)。
小嵜が参加した、ポスター発表の様子です。↓
全体を通じての感想
小嵜:コロナ禍や個人的な都合により久しぶりのCVPR参加となりましたが、非常に多くの刺激を受けるよい機会となりました。業務で触れる機会の多い点群・3Dシーンや外観検査の研究課題について、どのような困難があるか整理する助けになりました。研究者との議論から、実際に課題に触れなくては気づけないような細かい点、例えば同じアルゴリズムのオープンソース実装であっても結果が大きく異なるといった話題など、知識を広げることができ大変有意義でした。
CVPRに参加すると常にゆで卵が出されるように思うのですが、なぜなのでしょう。今年は日本のスーパーではあまりお目にかかれないベリーをたくさん食べることができて良かったです。
最後に、急遽海外出張を許可していただき旅費をサポートしてくれた会社に感謝します。
※記載されている会社名、ロゴ、システム名、商品名、ブランド名などは、各社の商号、登録商標、または商標です。