「XR」に関する世界最大のエキスポ「AWE USA2026」視察 速報サマリーNo.3
「XR」世界最大のエキスポ「AWE USA2026」視察 Day3速報
こんにちは、サービシンクの名村です。
一昨日から主題のアメリカのロサンゼルスで開催されている「XR」の関する世界最大のエキスポ「AWE USA2026」に来ており、今日が現地3日目、イベントとしては4日目の最終日です!
本日も様々なカンファレンスを視察してきました。多くのセッションの中で弊社としてはXR領域の中でも主に「AR」領域、そして更にはWeb制作・システム開発を主領域としているサービシンクとしては「AR✕Web」という視点での視察結果となっているのはご了承をお願いいたします。
AWE USA2026 開催概要

| 会期 | 2026年06月15日 ~ 2025年06月18日 |
| 開催地 | ロングビーチ / 米国 / 北米 |
| 会場 | Long Beach Convention Center |
| 出展対象品目 | 空間コンピューティング、クロスリアリティ(XR)、拡張現実(AR)、仮想現実(VR)、複合現実(MR)、AI、バイオインターフェース、ハプティクス、5G、ストリーミング、スタートアップ、投資 |
| 主催者 | AWE XR, LLC |
| 業種 | 情報・通信/通信、情報処理、コンピュータ 情報・通信/新聞、放送、映像(映画、フォト) 趣味・教育/玩具、遊戯用具、ゲーム用品 イノベーション・スタートアップ/イノベーション・スタートアップ |
| ウェブサイト | https://www.awexr.com/usa-2026 |
開催は2026年6月15日からですが、初日はウェルカムパーティーなどが主でもあったので、セッションが具体的に開催される2026年6月16日より参加してきました。
2026年6月18日 視察セッション目次
- The Wild West of Storytelling: From Hollywood Legacy to Immersive Worlds(物語表現の「西部開拓時代」 ― ハリウッドの遺産から没入型世界へ)
- From Operating Room to AR Reading Room: Building Trust Through XR(手術室からAR読影室へ ― XRで信頼を築く)
- PANEL: Demystifying World Models(パネルディスカッション:ワールドモデルの正体を解き明かす)
- Building Smart Glasses People Actually Wear: A Validation Framework for ProductLeaders(人が実際に身につけるスマートグラスをつくる ― プロダクトリーダーのための検証フレームワーク)
- Debating the Hardware, Software and Social Implications Driving AR with the Display Skeptics(「ディスプレイ懐疑派」と議論する ― ARを動かすハードウェア・ソフトウェア・社会的影響)
- AI-Driven Companion in XR(XRにおけるAI駆動型コンパニオン)
- AI Integrated XR/Smart Glasses and the Next Human-Machine Interface(AI統合型XR/スマートグラスと、次世代のヒューマン・マシン・インターフェース)
- How BCI is Removing the Friction from AR and AI Interaction(BCI(ブレイン・コンピュータ・インターフェース)がARとAIの操作からフリクションを取り除く)
- The View In 2036: How New Headmounted Devices and Always-On AI Will Change the Way We See the World(2036年の視界 ― 新たなヘッドマウントデバイスと常時稼働AIが、世界の見え方をどう変えるか)
- Optics Technologies Trends for the Next Generation of Smart Glasses(次世代スマートグラスを支える光学技術のトレンド)
- OpenXR Deep Dive: From Runtime Architecture to Spatial Computing(OpenXR徹底解説 ― ランタイムアーキテクチャから空間コンピューティングまで)
- AWE USA 2026 Wrap-up and Best in Show Awards(AWE USA 2026 クロージング & ベスト・イン・ショー授賞式)
PANEL: XR and AI at Work: From Real-Time Guidance to Edge Deployment(09:00 AM - 09:55 AM 視察:名村)
AWE USA 2026の最終日、メインステージで行われた「The Wild West of Storytelling: From Hollywood Legacy to Immersive Worlds」を視聴しました。登壇は俳優のBilly Zane氏、CalArtsでLBE(Location-Based Entertainment)教育プログラム「D.R.E.A.M.S.」を率いるTravis Cloyd氏、モデレーターはObserve MediaのDeborah Worrell氏です。
このセッションはサービシンクが主軸に置く「AR空間におけるWebサイトの表示」「Web技術との融合」というテーマと直接合致する部分は多くありませんでした。 中心話題は、レガシーIP(既存の映画作品や俳優)をどう没入型体験に展開するか、故人を含む「デジタルヒューマン」の権利処理と制作、そしてLBEという「場所に紐づく体験」の設計でした。Web制作の観点から得るものを期待すると、やや遠い議論です。
ですので本稿は個別技術のレポートではなく、当社のAR×Webという研究関心から「それでも拾える論点」を抽出する形でまとめます。
メタ要素1:「四角い画面の外へ」という方向性は、当社の前提と一致している
セッションを貫いていたのは「物語は長方形のスクリーンの中に閉じていない」という認識でした。Cloyd氏は、映画館で始まった物語が、グラスを装着して街中のバスで移動しながら各所のアクティベーションで断片的に展開し、再び劇場に戻って完結する、というハリウッド大通りでのパイロット構想を語っています。
これは表現上はエンタメの話ですが、構造としては当社が2018年来主張してきた「デジタル情報の表示先が、固定された画面から『AR空間』へ移行する」という見立てと同じ方向を向いています。彼らがやっているのは、二時間の映画における受動的な映像を、空間に分散配置された短い体験の連なりへと組み替えることです。これは過去の当社ブログで整理した「情報への到達経路そのものを組み替える」という論点と、対象がWebコンテンツか物語かの違いはあれ、骨格が重なります。
メタ要素2:「都市スケールの情報配置」は、エンタメを超えてPOI・市民サービスに及ぶ
もう一点、見逃せない発言がありました。Zane氏は、このデジタルツインの空間レイヤーは物語のためだけのものではなく、都市内での移動の補助、POI(地点情報)、さらには医療を含む生活上必要なサービスへの到達手段にもなりうると述べています。
これはまさに、当社が「AR時代において、Webサイト側はどんな情報をどのように公開しておくべきか」と問うてきた領域です。街区にデジタル情報を重ねるという発想が、エンタメ企業の側から「都市インフラとしての情報配置」へと自然に滑り出している点は、「エンタメ(仮想)→リアル」である、「AR×Web」の実用化を考える上で示唆的でした。また現在弊社のMissionでは「Webの技術をリアルの広げる」と掲げています。誰がその情報を更新し、正確性を担保し、利用者ごとの文脈差に追従するのか── 当社が繰り返し指摘してきた「情報設計と運用設計の問題」が、ここでも背後に控えています。
一方で、当社の主軸とは明確に距離がある点
公平に書けば、登壇者の関心の中心は「IPの新たな収益化経路」と「権利・契約・ブロックチェーンによる真正性の担保」でした。「Web標準」や「ブラウザ」、「更新性」といった話題はほぼ登場しません。また「LBE」という形態自体、利用場所が固定され、体験時間が短く、再訪を前提としない── 当社が「スケールしないAR体験の条件」として整理してきた特徴をむしろ多く備えています。その意味で、本セッションは当社の仮説の反証ではなく、「まだWeb的な運用構造に到達していない、エンタメ側からの空間活用の現在地」として位置づけるのが妥当だと考えています。
それでも「物語も情報も、四角い画面を出て空間へ向かう」という大きな潮流が、ハリウッドという全く異なる出自からも語られたことは、当社の研究の方向性を側面から補強する一次情報でした。
From Operating Room to AR Reading Room: Building Trust Through XR(10:00 AM - 10:25 AM 視察:名村)
今回のセッションは、サービシンクが主軸とする「AR領域におけるWeb技術の融合」とは直接的に合致する部分は少なかったですが「情報を、いかに受け手に届く体験へと設計するか」というクリエイティブの視点においては、見習うべき示唆に富んだ内容でした。
本セッションは、医学博士課程の学生でありアニメーターでもあるStephen Christian氏と、小児外科医のDr. Patrick Thomas氏による、医療現場でのXR活用と「信頼(trust)の構築」をテーマとしたものでした。
Thomas氏は、血圧や心拍といったバイタルサインの中で「最も重要なバイタルサインは『信頼』である」と述べました。遠隔地から紹介された腫瘍の患者に対し、3Dモデルやバーチャルリアリティで病状を可視化し、さらに執刀前に外科チームで手術計画をシミュレーションした事例を紹介。「腫瘍がある」という言葉だけで頭が真っ白になってしまう患者・家族との対話を、「これがあなたの腫瘍です。この症状はこう感じるはずです」という具体的な対話へと変えた、という話です。技術を持ち込むことが、むしろ患者との信頼を築く手段になっている点が印象的でした。
「正しいが無機質」では体験にならない
本セッションの核心は、Christian氏が説いた「抽象化の力(the power of abstraction)」にありました。これは医療の話というより、情報設計(IA)そのものの問題提起として受け取るべき内容です。
医学的に正確なテキストは、情報としては「正しい」。しかしそれだけでは、受け手は内面化できず、行動も変わらない。「情報としては正しいが無機質」な状態では、ユーザー体験は成立しないのです。
Christian氏はこれを、自身のプロジェクト「Cootie Catchers」で具体的に示していました。ニキビの原因菌である「C. acnes」という正確だが無機質な医学情報を、キャラクター化した物語へと変換する。皮膚を「島」に、毛包を「巣」に見立て、炎症が広がる過程を物語の展開として描く。テキスト→コミック→没入体験へと段階的に抽象化することで、専門知識を「内面化できる」情報へと変えていくのです。彼は「細部を足して過度に具体的にするほど、人は自分ごととして捉えられなくなる。むしろ単純化し、ファンタジーにするほど内面化できる」と述べていました。
ここで本質的なのは、正確さに「情感(エンターテイメント性)」をどう接続するかという設計判断です。情報を増やすのではなく、受け手の理解構造に合わせて再設計する。これは当社が一貫して論じてきた「ARは情報の提示フォーマットの変化ではなく、情報アクセス経路そのものの再構築である」という視点と、媒体こそ違えど地続きです。Webであれ空間であれ、「正しさ」と「情感」の両立は、情報設計の中核課題であり続けます。AWE 2025で確認した「情報量を増やすのではなく、どう見せ、どう見せないかを設計する」という要件とも、同じ問題意識の上にあります。
残った疑問──「2D→XR」をどう仕組み化するか
一方で冷静に見れば、この成果はChristian氏自身が10年以上のアニメーターのキャリアを持つからこそ実現できたものでもあります。物語化、キャラクターデザイン、視覚的な抽象化──いずれも高度なクリエイティブの素養に支えられています。
ここに、私が質問したかった論点が残りました。すなわち、アニメーション制作の素養を持たない多くのクリエイターが、同じ品質で2DコンテンツをXR体験へと変換していくための「仕組み」は何か、という点です。仮にそれをAIで担うとしても、「正しさ」と「情感」を両立させる抽象化の判断──どこを削り、どこを誇張し、どう物語に落とすか──を、属人的な才能から再現可能なプロセスへ落とし込めるのか。
この問いは、情報を空間へ展開していく上で当社にとっても避けて通れない課題です。Web制作が培ってきた情報設計や運用設計の知見が、空間コンピューティングにおける優位性になりうると考えていますが、その「優位性」を個人の才能ではなく仕組みとして再現できて初めて、事業として成立します。ぜひ登壇者に投げかけたかった点でした。
技術発表ではなく実践報告でしたが、「正しいが無機質」を超えるための抽象化と情感の設計という、Web・空間を問わず通底する課題を再確認できたセッションでした。情報を正しく持つことと、それを人が受け取れる体験にすることの間には、依然として大きな設計の溝がある──その溝をどう仕組みで埋めるかが、次の問いだと感じています。
PANEL: Demystifying World Models(10:17 AM - 11:00 AM 視察:藤原)
登壇:(モデレーター)Bilawal Sidhu(TED Conferences)/ Sharon Lee(Moonlake AI 共同創業者)/ Matt Miesnieks(Primate Intelligence・CEO)/ Ahmed Ahres(Reactor 創業メンバー)/ Grand Ballroom・Main Stage / 6/18 10:17〜11:00 / [公式](https://www.awexr.com/usa-2026/agenda/2169)
「ワールドモデル」は、ざっくり言えば「世界の仕組みを、コンピュータが内部に持つモデル」のこと。いま AI 界で急に注目される一方、各社がてんでに違うものを指してこの言葉を使っている。そのワールドモデルを、まったく違う 3 つの哲学・技術で攻める 3 社が、互いに問いを投げ合う対話形式のパネル。Matt はこの場で活動を伏せた状態(ステルス)を解き、社名を Primate Intelligence と明かした。
そもそも「ワールドモデル」とは何か(定義はあいまい)
- Sharon は、Nvidia の Jim Fan や Stanford の研究者らとの議論を引き、「ワールドモデルとは、世界のどこかの部分をモデル化したものだ」と整理。実際、数週間前には「メール配信キャンペーンのワールドモデルです」と称する売り込みがあり、それは本当にワールドモデルなのかと疑問の声が出たという。だが定義が緩すぎて、こじつけだと切り捨てることすらできない。それくらい言葉があいまいになっていて、各社が「ワールドモデル」を名乗りつつ、てんでに違う課題へ取り組んでいる
- 3 社のアプローチもまったく異なる。Sharon=物理 AI(ロボット)の学習・評価用シミュレーション、Matt=人間の脳に近い抽象的なワールドモデル、Ahmed=リアルタイムの対話的な動画生成
3者3様のアプローチ
- Moonlake AI(Sharon Lee):物理 AI 向けのシミュレーション基盤。入力は 1 枚の画像で、たとえば厨房を撮ると 3D 再構成し、その仮想環境でロボットを動かす。仮想で動けば実機へ転移できるので、現地での数百時間の調整コストを省ける。製造業や飲食店などへ提供中。コード表現とニューラルレンダリングのハイブリッドが特徴
- Primate Intelligence(Matt Miesnieks):Yann LeCun が提唱する JEPA という学習法に賭ける。人間の脳のように「概念どうしのつながり」で世界を理解・予測する抽象モデルで、シミュレーションは回さない。当面は動画を入力し、何が起きているかの理解を JSON(構造化したデータ)で返す。桁違いに小さく、デバイス上でリアルタイムに動き、決まった答えしか返さない(でっち上げ=ハルシネーションが無い)のが売り。社名は「言語なしで世界を理解できるか(動物はできる)」という問いに由来
- Reactor(Ahmed Ahres):ワールドモデル=リアルタイムで対話できる動画生成、と捉える。過去は一方的に見るだけだった映像がリアルタイムに反応するようになると、地図に対する GPS のように、当初は誰も想像しなかった用途(Uber や Amazon のような)が開く。3D の設計データを経由せず、画面に映る映像そのもの(ピクセル)を直接その場で生成する立場。API 経由で各種のリアルタイム対話動画を提供(react.inc)
3D を経由するか、映像を直接出すか(最大の論点)
論点は、3D 表現と 2D 表現をどう組み合わせるか。Sharon は 3D を支持。何も無いところから 2D 映像をでっち上げる(幻覚させる)のでなく、3D というデータベースから引くほうが描画として効率的。さらに、扱う部分(コーヒーカップや皿のように掴む対象)は物理的に精密に、背景は見た目が似ていれば十分、と計算資源を配分でき、低消費電力デバイスでも効く、とした
Ahmed は逆の主張。3D は 1960 年代以来の制作手法にすぎず、世界には十分な量の 2D(動画)データがあるが、高品質な 3D データは足りない。多くの企業が「動画 → 3D 再構成 → 学習 → 映像出力」と回しているが、回り道をせず最初から映像(ピクセル)を直接生成すればよい、と。課題はメモリで、Genie 3 などの現行モデルは振り向くと先ほどのキャラクターが消えてしまう。だが LLM の扱える文脈の長さが 10 万から 100 万トークンへ伸びたように、これも時間の問題だと見る
Matt は、言語モデルは物理世界の理解には行き止まり、という LeCun の見方に同意。現実は離散化(トークン化)しきれない例外だらけで、データセットに縛られない新しい理解の仕方が要る。JEPA は桁違いに少ないデータと計算で済む、未実証だが有望な賭け
エッジ・低消費電力での実行
Matt は、ワールドモデルが最も活きるのはロボット・グラス・ドローンといったエッジ(手元のデバイス側)で、そこでは GPU でなくワット(電力)が制約になる、と問題提起
Sharon は 3D 表現の効率性が低電力で効くと回答。Ahmed はメモリ次第で映像の直接生成も実行可能になると見る。Matt は JEPA の小ささがエッジに向くと主張。三者三様だが「最終的にエッジで動く」という見立ては共通
ユースケースの見立て
Ahmed(自称・楽観的テクノオプティミスト)は 3 つを挙げる。(1) コンテンツ制作:Veo 3 などの動画生成 AI は「プロンプトを打って祈る」だけで制御が弱い。スマホ撮影のように結果がその場で見える即時フィードバックこそ究極の制御で、AI が高品質コンテンツを作る鍵。(2) 教育:ピカチュウと電気を学ぶ、アインシュタインとリアルタイムで学ぶ、世界一の選手とテニスを学ぶ、といった没入学習。(3) まだ名前のない新しい対話型体験(映画とゲームの中間。Netflix の Bandersnatch のような分岐の先)
Matt は、JEPA が当たれば「未知の環境でも正しく安全に振る舞える汎用知能(ロボットの脳)」が長期の用途。ただし当面は動画インテリジェンス(物体だけでなく行動をリアルタイムに安価に検出、広告挿入、フロンティアラボの学習データの検証・監査)に寄せている。「世界に安全カメラは約 10 億台あるが、人型ロボットが 1 年で 10 億台売れる未来は見えない」
Sharon は、世界を作り直すほうが、その世界で完璧に振る舞うルール(ポリシー)を学習させるより易しい(囲碁のルールを示すほうが、AlphaGo を倒すより易しいのと同じ)として、環境(シーン)作りに集中
家庭用ロボットと「信頼」
家庭で使える汎用人型ロボットはいつか、という問いに、Matt は「ほぼ今日でも存在するが、まだ役に立たない。高齢の親を任せられる水準は 10 年ほど先」。管理された工場環境で動くロボットを別の家に置くと一気に壊れる、未知の環境への一般化こそ最難関で、ハードやバッテリー以上に難しい、とした
Ahmed は、自動運転(Waymo が 2016 年想定から遅れたのもエッジケースが理由)を引きつつ、家庭用ロボットの本当の壁は性能でなく「人間の信頼」だと指摘。退屈な家事は任せても、子どもを完全に任せるかは別問題。Matt は「人は犬を赤ちゃんのそばに置く。犬と同じくらい信頼できるロボットなら、天才的に賢くなくてよいのでは」と返した
XR との接点
Ahmed は、XR が本領を発揮していない最大の理由を「世界やコンテンツを作るのが難しすぎること」とみる。自身、Quest 3 の簡単な AR ホッケーを動かすのに半年かかった。iPhone アプリが作りやすくなって市場が立ち上がったように、高品質コンテンツを作りやすくすれば XR は伸びる。XR は人間の脳を例外的にだます力があり、教育・訓練・共感・PTSD 治療など可能性が大きい、と
Matt は、AR/VR デバイスを着けた人間は「生物の腕と脚を持ったロボット」と同じだと指摘。見たもの・聞いたものからワールドモデルを作り、デバイス上でリアルタイムに動かす、という課題はロボットと同型。まずバッテリーや GPU の大きいロボットから始め、いずれ Snapdragon チップのグラスへ。Meta の AI グラスに世界の理解を尋ねても今はうまく答えないが、そこに大きな余地がある、と
各社が「失敗するとしたら」
Matt の問い「完璧に実行しても会社が死ぬとしたら、何が殺すか」。Ahmed=タイミング(2 年内にリアルタイム動画が期待水準の品質に届かないこと。市場でもチームでもなく純粋に時期の問題。VR の 2012 年なのか 2024 年なのか)。Sharon=ロボット配備が遅れること(評価サービスがロボット展開に依存するため)。Matt=市場でなく技術リスク(JEPA がまだ研究段階で、商用化に耐えないまま終わる可能性)
「PANEL: Demystifying World Models」セッションへの R&D 担当 藤原のまとめ
「ワールドモデル」という同じ言葉を、3 社がまるで違う意味で使っているのが、まず面白い回でした。定義が広すぎて、「メール配信キャンペーンでさえワールドモデルといえる」という Sharon の整理は、流行り言葉を扱うときの良い戒めだと感じます。私に刺さったのは「3D を経由するのは遠回りで、最初から映像(ピクセル)を直接生成すればいい」という Ahmed と、「3D というデータベースから引くほうが効率的」という Sharon の対立です。
一度きちんと構造を作って必要な分だけ引く、という考え方は、私たちが普段から大事にしている発想とも通じるので、どちらの筋も他人事ではありませんでした。Matt の「デバイスを着けた人間はロボットと同じで、見聞きしたものからワールドモデルを作り、エッジでリアルタイムに動かす」という整理も示唆的です。そして三者に共通していたのが、これらのモデルは最終的にクラウドではなくエッジ(グラスやロボット)で、電力という制約のなかで動く、という見立てでした。
どこで計算し、何をどの粒度で持つか、という問いは、これからの Web を考えるうえでも効いてくると感じます。
Building Smart Glasses People Actually Wear: A Validation Framework for Product Leaders(10:40 AM - 11:05 AM 視察:名村)
このセッションはは製品開発側の「バリデーション(検証)手法論」が中心で、Web技術への言及はありません。ですが、その手法論が前提に置いている設計思想は、弊社がこれまで述べてきた論点とメタレベルで強く重なるものでした。
スマートグラスは機能不足で失敗するのではない
両氏の主張の出発点は明快です。スマートグラスが失敗するのは機能が足りないからではなく、「デモで見せる魔法」と「毎日身につけられること」の間にあるギャップが、早期に・体系的に・部門横断で検証されないからだ、というものです。
ここで弊社が重要だと感じたのは、彼らが検証(バリデーション)を「出荷直前の品質チェック」ではなく「最適な製品へ舵を切るための操舵機構」として位置づけていた点です。
具体例として、機器の表面温度が挙げられていました。「38度でシャットダウン」という基準はダッシュボード上では常に緑(問題なし)でしたが、実際には肌に触れる30度ですでに不快であり、34度で性能を絞り、36度で停止する設計へ修正したといいます。
「平均では使える、しかし使われなくなる」
もう一点、強く印象に残ったのが「平均値ではなく最悪値で測れ」という指摘です。音声起動の成功率が週平均98%でも、ある日5回連続で反応しなければ、ユーザーはその体験を「失敗」として記憶し、二度と使わなくなる。だからこそ最悪ケースの性能を計測対象にすべきだ、と。
この一連の議論は、弊社が昨年度のAWE総括で述べた「成功事例とは、問題が起きにくい条件・文脈を先に作っているケースにすぎない」という主張と、構造的に同じことを指していると感じました。単発・短時間・状況依存の体験では露呈しない設計上の欠陥が、日常利用・再訪を前提にした瞬間に「使われなくなる理由」として顕在化する。彼らはそれを製品検証の言語で、弊社はWeb設計の言語で語っているにすぎません。
Web設計者にとっての含意
そして両氏は、品質が宿るのは部品単体ではなく部品と部品の「継ぎ目(seams)」であると述べました。これはWeb制作における情報設計やシステム統合で我々が日々向き合っている問題そのものです。
弊社はAR空間をWebコンテンツの次の表示先と位置づけ研究を続けていますが、その前提として「ハードウェアは制約条件である」という認識を重視してきました。今回のセッションは、その制約条件をいかに早期に・定量的に検証し、設計判断へ還元するかという、実装現場の具体的な方法論を補完してくれるものでした。AR×Webという我々の本筋には直接触れないものの、その地盤を固める議論として、確かな手応えのある25分間でした。
Debating the Hardware, Software and Social Implications Driving AR with the Display Skeptics(11:20 AM - 12:00 PM 視察:名村)
本セッションは弊社が主軸に置く「AR×Web」という論点とは、直接的には合致しません。Micro LED/Micro OLED/LCoS((Liquid Crystal on Silicon)というディスプレイ方式の比較、バードバスや回折・幾何導波路といった光学系、カメラ・調光モジュール・度付きレンズといった付加ハードウェアの是非など、極めてハードウェア寄りの技術論が中心でした。
しかし本セッションは、弊社にとって「否定的に受け止めるべき内容」ではありません。むしろ論点が明確になったこと自体が大きな収穫だと考えています。
「置き換え」を否定する主張が、結果的に弊社の論旨を補強した
象徴的だったのが、Reit氏の「スマートグラスがスマートフォンを置き換えることは決してない」という、あえて挑発的に置いた主張です。
私は従来、PCは持ち歩けず、スマートフォンも画面サイズを拡大できない以上、デジタル情報の表示場所は巨大なスクリーンとして扱えるAR空間へ移行する、と述べてきました。一見、私の主題と真っ向から対立します。
ですが、両氏の議論を精査すると、その結論はむしろ私の論旨を補強するものでした。登壇の両氏が一貫して指摘したのは、スマートグラス「単体」に全ての処理を背負わせる設計には、構造的な無理がある、という点です。消費者向けグラスはサイズ・重量・スタイル・電池持ちのすべてで極めて厳しい制約を抱え、しかも消費者は業務利用と違い「本当に欲しいか、毎日かけるか」というより高い価値基準を要求します。実測値として、Meta Ray-Ban Displayのカメラ単体で1.7Wを消費し、広告される「8時間」の実態は混在利用で約40分だという数字まで提示されました。
ここで決定的に重要なのは、両氏がスマートフォンを「ポケットの中の演算装置(compute puck)」として共存させる前提に立つなら、スマートグラスは本質的に有用で強力な製品カテゴリになり得ると明確に認めていたことです。つまり彼らが否定したのは「グラス単体による完全な置き換え」であって、「スマートフォンと共存しながら、表示・閲覧のデバイスがグラスへ移っていくこと」ではありません。これは弊社が一貫して述べてきた見立てと構造的に完全に一致します。問題は置き換えか否かではなく、役割の再配分なのです。私の論旨の根幹は、増え続ける情報量をモニターサイズに縛られたスマートフォンでは捌けなくなる、という点にあり、その受け皿としてのAR空間という主張は、本セッションの議論とむしろ整合します。
ディスプレイは「ほぼ出揃った」、しかしキラーアプリは不在
技術論の要点も整理しておきます。両氏の見立てでは、フルカラーかつ導波路という条件ではLCoSが依然として現実解であり、Micro LEDは緑単色なら有望だが、フルカラー化は10年前と同程度に遠い、とのことでした。発色品質ではMicro OLEDが優れ、輝度向上も進んでいます。「アマチュアは電池を心配し、プロは発熱を心配する」というGuttag氏の言葉に象徴される通り、ハードウェアの課題は熱・光学効率・度付き対応といった輪郭のはっきりした制約条件として整理されつつあります。
その上で両氏が率直に認めたのが、キラーアプリが依然として不在だという点です。表示と光学の選択肢は出揃いつつあるが、「スマートフォンを取り出せば済む」ことを超える、グラスでしか実現できない用途がまだ見えていない。Reit氏はその候補として、視線トラッキングによる眼の継続的な生体・医療モニタリングを挙げていましたが、これも今後12〜18か月の検証待ちという段階です。
弊社の関心「Web」との接点 ― 課題は情報設計と運用設計にある
この「キラーアプリ不在」という論点こそ、弊社の関心と接続する部分です。ハードウェアの選択肢が固まりつつある今、次に問われるのは「何を表示し、どう運用するか」という上位の設計です。これはまさに、弊社が過去のAWEレポートで繰り返し述べてきた「ARの本質的課題はハードウェアではなく、情報設計・運用設計にある」という論点そのものです。
ハードウェアが制約条件として輪郭を現したからこそ、次は「その制約の上で何を見せ、何を見せないか」という設計判断が主戦場になります。視界を占有しない、操作を前提にしない、更新・運用に耐える――こうした条件を満たす情報の組み立ては、Web制作が情報設計(IA)やアクセシビリティ、継続運用の現場で長年培ってきた知見と構造的に重なります。また「アイトラッキング」に関しては弊社でも現在R&Dでの大きなテーマ担っています。アイトラッキング、つまりは装着者がどこを見ているか、というデータを弊社では特に重要視しており、このデータを「フィジカルデータ」と呼称して現在それを何に活用するか、活用できるかを調査していたところでした(現在あるプロダクトを開発しています)。その点においても、このセッションは大きな意味がありました。
「Display Skeptics」という懐疑の立場から語られた本セッションは、結果として、スマートグラスがどこで詰まり、どこに伸びしろがあるかを冷静に可視化してくれました。懐疑は否定ではなく、現実を直視するための解像度です。その解像度の先に、Web制作が貢献できる領域があると、改めて確信したセッションでした。
AI-Driven Companion in XR(01:00 PM - 01:25 PM 視察:名村)
このセッション内容の中心は、孤独や社会的孤立の解消を目的とした「AIコンパニオン(伴侶)」をAR空間に可視化するという研究構想です。Webコンテンツの表示先や、Web技術との統合といった論点はほぼ登場しません。また、これは製品発表ではなく、ノルウェー研究評議会に申請中の4年計画の提案段階にある構想である点も補足しておきます。
それでも、現地で一次情報として聞いた価値はありました。弊社が一貫して掲げてきた「ハードウェアは制約条件」「ARは情報アクセス構造の変更」というメタ視点から読み解くと、拾うべき論点が確かにあったためです。以下、その観点で整理します。
主張の核:「co-presence(共在感)」という概念
登壇者の主張の核は「co-presence(共在感)」という心理学的概念でした。スクリーン上のAIは2Dで奥行きがなく、スマホを閉じれば関係も途切れる。ロボットは物理的に存在できるが高コスト(1〜3万ドル)で、設置場所に固定され、拡張性に欠ける。これらの限界を超える解として、「物理空間に空間アンカーされ、360度から見え、環境変化に反応するARコンパニオン」が提示されました。
登壇者はこれを「より賢いチャットボットに3Dの皮をかぶせたものではなく、根本的に別カテゴリのAIの存在様式だ」と表現していました。重要なのは「賢さ」ではなく「ただそこに共に在ること」だ、という主張です。
メタ要素1:「常駐」を設計要件として掲げる姿勢
ここから、弊社がこれまで整理してきた論点と構造的に重なる要素を3点取り上げます。
第一に、「常時そこに存在し続けること」を設計要件として正面から掲げている点です。登壇者は、コンパニオンが対話のない時も消えず、本を読む・音楽を聴くといった「アイドルモード」で常駐すべきだと述べました。
これは弊社がAWE Asia 2026のレポートで整理した「視界を占有しない/常時表示は疲労や注意散漫を生む」という設計判断とは、正反対の方向です。情報(コンテンツ)を空間に常駐させることの価値と負荷は、用途によって真逆の結論になる——この対比は、Webコンテンツを空間へ展開する際の設計条件を考えるうえで示唆的でした。「常に出す」べきものと「必要な瞬間だけ出す」べきものの境界線は、今後の空間UI設計における重要な論点になると考えています。
メタ要素2:環境への適合を「前提条件」とする構造
第二に、「空間アンカー・オクルージョン(遮蔽)」・「照明整合」といった「環境への適合」を、体験成立の前提条件として扱っている点です。ソファが足を隠す、部屋の照明に影を合わせる、物の移動を検知して反応する。登壇者はこれらを演出ではなく、共在感を成立させるための必須レイヤーとして説明していました。
これはまさに、弊社が繰り返し述べてきた「ハードウェアと環境は体験を拡張する装置ではなく、設計が守るべき制約条件である」という認識と一致します。コンパニオンであれWebコンテンツであれ、空間に置かれた情報は「環境の一部として破綻しないこと」を最低条件として要求される。空間に出した瞬間、現実の物理法則や光環境との整合が問われるという構造は、表示対象が何であっても共通だと改めて確認できました。
メタ要素3:倫理を「アーキテクチャ」として設計する発想
第三に、登壇者が時間の多くを倫理的リスクに割いた点です。過剰な擬人化による依存、現実逃避、データ保護、人間関係そのものの代替——これらを「仮想の懸念ではなく、すでに起きていること」として具体的に列挙していました。
そのうえで「倫理はチェックリストではなく、設計すべきアーキテクチャだ」という言葉が印象的でした。透明性のある設計、専門家の評価、オンデバイス処理といった対策を、後付けではなく構造として組み込むという発想は、運用と継続性を前提に設計する我々Web制作の発想とも通じるものがあります。
まとめ:「常駐する情報」という別角度の検証材料
まとめとして、本セッションはAR×Webの直接的な論拠ではありません。しかし「空間に常駐する情報をどう設計し、どう環境に馴染ませ、どこで止めるか」という問いは、Webコンテンツの表現先が空間へ移行すると考える我々にとって、別の角度からの検証材料になりました。
特に「情報の常駐」をめぐる設計判断——出し続けることの価値と、それが生む負荷のトレードオフ——は、今後のR&Dで引き続き整理していきたいと考えています。
AI Integrated XR/Smart Glasses and the Next Human-Machine Interface(01:00 PM - 01:25 PM 視察:藤原)
登壇:Omar Abed(InvenSense〔TDK グループ〕|CTO)/ Promenade Room 104B(XR Enablement トラック)/ 6/18 13:00〜13:25 / [公式](https://www.awexr.com/usa-2026/agenda/2021)
半導体・センサー大手 TDK グループの InvenSense から、CTO の Omar Abed が登壇。スマートグラスを「AI と人と世界をつなぐ最も自然なインターフェース」と位置づけ、その普及を阻む要因を、センサーと消費電力の観点から解いたセッション。
AI の指数的成長と、スマートグラスという入り口
Omar は AI の急成長を 3 つの指数の掛け算で説明。ハード(ムーアの法則+フルスタックで計算力が約 8 か月で倍)、モデルの効率改善(約 8 か月で倍)、エージェント AI の自律性(介入の間隔が約 7 か月で倍)。人の脳は線形に考えるので、1〜2 年先すら見通しづらい
そのなかでスマートグラスは AI と現実をつなぐ自然な入り口で、根っこにあるのがセンサー。センサーが現実のデータを取り込み、次世代モデルの燃料になる。用途例として、コンロの消し忘れ確認、会議への出発を促す秘書、手術中のもう一組の目、新しい街でのナビ、母国語どうしのリアルタイム翻訳、自動化が進む工場での巡回支援などを挙げた
なぜまだ全員が掛けていないのか
理想と店頭の製品の間にはギャップがある。いまのグラスはかさばる、プライバシー問題(基調講演で言われた「カフェテスト」=カフェに入って人に逃げられないか)、短いバッテリー、スタイルと社会的スティグマ、シームレスでない UI、台数が少ないゆえのアプリ不足、そして 1,000〜2,000 ドルの価格。結果として最先端の早期採用層に留まっている
センサーが握る「電力」と「サイズ」
センサーは常に性能・電力・サイズの 3 つを取引する。性能は今や十分で、課題は電力とサイズ。終日装着(8 時間)には平均消費電力を 200 ミリワット未満へ、装着を忘れる「消える」感覚には 50 グラム未満へ落とす必要がある
最新のスマートグラスは 70〜90 グラム。フレームで 25〜30 グラム、センサーとアクチュエータが全体重量の約 15%、電力では約 7% を占める。次世代では重量を 3 割以上、電力を 3〜5 割削る目標。グラス 1 台にセンサーは 10〜20 個あり、配線(今は 4〜5 本)を 1 本へ減らす。視線・内向きカメラは超音波 ToF(飛行時間)センサーで置き換え、重量を大きく削る
ただし最大の変化はシステム側。事前推論とエッジ AI が、今後数年の革命的変化になる
フライホイールを回す:完全ワイヤレスイヤホンと VR の対比
普及の好循環(フライホイール)が回るか。対比例が完全ワイヤレスイヤホンと VR。完全ワイヤレスイヤホンは年 5 億台超だが VR は約 1,000 万台。差は、完全ワイヤレスイヤホンが周囲とつながったままデジタルを楽しめ、バッテリーが持ち、10 グラム未満(5 グラム未満も)で、日常の必需品になったこと。VR は世界から切り離し、装着 1 時間未満、500 グラム級で、ゲームなど特定用途の物珍しさに留まった
センサーの中身と「エッジでの計算」
- 現代のスマートグラスはフレーム当たり約 10 個のセンサー(今後 20 個へ)。IMU(ジャイロ+加速度)、回転・入力用の TMR 磁気センサー、マイク、ジェスチャ・視線・装着検知用の超音波 ToF
- 機能例:骨伝導(加速度計+マイクで、装着者本人の声かを判別し、他人の声でグラスが誤作動しない)、ヒンジ角度で開閉に応じた電源制御、光学手ブレ補正、SLAM 用の頭部姿勢、活動量計測、ハプティック、位置センシング
- 階層は「エッジ・スクエア(センサー自身)」が最も低電力・低遅延。センサーが門番として事前推論し、消費電力 1 ミリワット未満・遅延 10 ミリ秒未満を狙う。重い処理は Qualcomm のような SoC へ渡しつつ、データは端末内に留める。クラウドへ上げる場合も、生の音声・映像でなくメタデータに圧縮し、電力・遅延・プライバシーを同時に守る
人間の脳に学ぶ:200 ミリワットへの道
サーバ室で人間並みの計算をすると約 10 万ワット要るが、人間の脳は約 20 ワット(ハンバーガー 1 個の 400〜500 キロカロリー相当)。ここから 4 つの学び。①前頭前野的な「関連性の判断」をセンサー側で行い、SoC に全部を背負わせない、②注意のある対象だけに絞る文脈依存の圧縮(視線検知が効く)、③現実はアナログなので、センサー上でアナログ処理して変換コストを省く(アナログ AI)、④メモリと計算を同じ場所に置く分散化(データ移動の電力損を減らす)
視線検知で音声や映像を処理するデモも紹介。具体的には、韓国の伝統仮面(ヤンバンタル)や Dongdaemun Design Plaza(建築家 Zaha Hadid)の解説、カップ麺の値引き情報(4,800 ウォン → 3,100 ウォン)を、視線の先に応じて返していた
締めの 3 点とロードマップ
- プライバシー:エッジ計算でデータを本人の端末に留め、メタデータだけ送る。
- 終日バッテリー:今のグラスは 1 ワット超で、その 6 割超はディスプレイが消費。ディスプレイ革新、部品の duty cycle(間欠動作)、事前推論・エッジ AI で 200 ミリワットへ。
- フライホイール:今後 12 か月で大手コンシューマー各社が製品投入し、2〜3 年でディスプレイ成熟・次世代センサー・SoC が揃い、空間計算と UI がシームレスになると見込む
「AI Integrated XR/Smart Glasses and the Next Human-Machine Interface」セッションへの R&D 担当 藤原のまとめ
センサー屋さんの視点から、スマートグラスの普及を電力とサイズの問題として解いていく話でした。「人間の脳は約 20 ワットなのに、サーバで同じことをすると 10 万ワット」という対比から導く設計思想は興味深いものでした。
なかでも、センサーが門番として「いま関連する情報か」を手前で判断し、SoC に全部を投げない、視線の先に注意を絞って文脈依存で圧縮する、という考え方は、情報を全部処理してから選ぶのではなく、要るものを早い段階で見極める発想で、扱う対象がデータでもコンテンツでも通じると感じました。
クラウドへ生データを送らずメタデータだけ上げることが、電力と遅延だけでなくプライバシーも同時に守る、という三方良しの整理も納得です。完全ワイヤレスイヤホンと VR の対比(周囲の存在とつながったまま使えるかどうかが明暗を分けた)も、新しいデバイスが日常に居座れるかを考える物差しとして覚えておきたいところでした。
How BCI is Removing the Friction from AR and AI Interaction(01:40 PM - 02:05 PM 視察:藤原)
登壇:Guy Wagner(Wearable Devices Ltd.|創業者・President・チーフサイエンティスト)/ Promenade Room 104B(XR Enablement トラック)/ 6/18 13:40〜14:05 / [公式](https://www.awexr.com/usa-2026/agenda/2069)
Mudra(ニューラルリストバンド)で知られる Wearable Devices の Guy Wagner が、BCI(脳・身体とコンピュータのインターフェース)で AR と AI の操作から摩擦を取り除く、という構想を語ったセッション。冒頭、本人が「このスライドは PowerPoint で作った。Claude も Gemini も ChatGPT も試したがうまくいかなかった。AI が私の意図を理解しないからだ」と切り出し、この回の主題を予告した。
12 年の蓄積:生体センサーから「意図」を読む
Wearable Devices は 12 年にわたり、超高感度の筋電(EMG)センサー、IMU・EMG・PPG を融合したウェアラブル、そして人の手の動きと意図を理解するアルゴリズムを開発
応用は複数領域。健康(脳卒中後のリハビリ)、産業(工場で従業員の手の使い方を学ぶ)、そして主軸は人とコンピュータの対話、とくに AR グラスの操作。マイクロジェスチャで操る同社のニューラルリストバンドは、市場初。当初は「カメラもコントローラもあるのになぜ要るのか」と理解されなかったが、業界が後を追い始めている
なぜ AI は「意図」を理解しないのか
いまの AI は、同じプロンプトを与えれば状況が違っても同じような答えを返す。こちらの設定や状況を汲まず、リアルタイムに反応せず、先回りもしない。行間も読めない。ロボティクスや安全が問われる場面では、周囲の人の意図や必要を読めないことが安全問題にもなりうる
そこで同社は研究部門「ai6 Labs」を立ち上げ、人の意図と AI エージェントをつなぐ「アライメント層」を作る、とした
「意図」とは何か:ワールドモデルのアライメント
あらゆる生物は、世界の振る舞いを説明するワールドモデル(過去の記憶・経験の総体。数十億パラメータ規模に相当)を持つ。だが現実は変化するので、生物はモデルを現実に合わせて更新し続けたい衝動を持つ。この「ズレ(アライメントギャップ)を埋めようとする衝動」こそが意図だ、と定義
仕組みは、知覚(現実)と予測(モデル)を比べ、ズレていれば予測を更新するか、世界に働きかけて知覚を変えるか。例:コーヒーを飲もうとして空だと気づいたら、誰かに頼んで満たす(世界に働きかける)か、空だと受け入れて動く(予測を更新する)。内部モデルと知覚を持ち、両者を一致させ続けようとするものが「エージェント」であり、意図を持つものがエージェント
### 言葉だけでは意図は伝わらない
2 つのエージェントが協調するには世界観を共有する必要があるが、パラメータは数十億あり、共有できるのはごく一部。共有できるのは観測可能な振る舞い(ボディランゲージ、手の動き、表情)と言語。だが言語は観測可能な振る舞いの最大 30% にすぎない。テキストだけに絞ると、共有できる意図は大きく目減りする
人どうしはアイコンタクト、頭・手のジェスチャ、ボディランゲージ、声、さらには匂い(EDA=皮膚電気活動のように、ストレスに反応する)まで使って通じ合っている
生体信号から読める 3 つの手がかり
体の感覚は科学で計測できる。空腹・怒り・興奮(胃の動き、心拍、震え)、嘘や不当な扱いへの「直感」も、すべて計測可能な身体信号の記述
とくに興味深い 3 つ。①ジェスチャ:手の動きは無作為でなく、話す言葉やその韻律と相関する。手のジェスチャと発話は同じ脳領域が司るため、手から「言いたいこと」を補える。②心拍・運動の同期:集中・フロー時は同期し、気が散ると同期が崩れる。これはセンサーで即座に分かる。③筋緊張:危険や行動に備えると上がり、寒いと震える(体温の手がかりにもなる)
これらの同期パターンを学習させれば、人の体を、自分の心が自分を理解するように、協働相手を理解するように、理解できる。同社はこれを、運動単位活動電位(MUAP=神経を走るスパイク。筋肉を制御するコード)から作るモデルと位置づける。LLM に人をよりよく理解させる土台になる、とした
摩擦と、それを AI に肩代わりさせる
過去 50 年、PC でもスマートウォッチでも最新 AR でも、操作は「コントロールパネルをボタンと GUI で操る」同じ枠組み。ピザを頼むにも、タスクを小分けし、カーソルを動かし、アイコンを選び…という中間の手順が「摩擦」。AI エージェントに期待するのは、この摩擦を取り去って結果だけをくれること
だがアライメント自体が摩擦で、知覚と予測を合わせ続けるのは消耗する。プロンプトを書くのは、PRD を書いてエンジニアに渡すプロダクトマネージャーのようなもの。言葉どおりに作られても、望むものとズレる。テキストを足しても、micromanage しても本質は解けない。そこに生体信号を入れれば、LLM は体から今の状況・感情・反応を理解し、先回りもできる。摩擦は無くならないが、AI エージェントが摩擦を肩代わりしてくれる
こうなると世界はどう変わるか
適応的な AI(状況ごとに違う答えを返し、先回りする)と、適応的な空間(家が、本人の信号から休みたい・集中したいを察して照明を変える)。パスワードや認証は不要になる(エージェントが本人を知っている)。買い物も「本当に欲しいか」を体が教える。
人とロボットの協働では、周囲の人の次の動きを予測でき、安全で快適になる
製品とプラットフォーム
開発・研究キット「Mudra Pro」(EMG+PPG+IMU を統合。プリオーダー受付中)。開発中の「Mudra Ultimate」は 8 チャンネル EMG と強力なマイコンで、デバイス上でアルゴリズムを動かせる(現行の Mudra Band は 3 チャンネル EMG)。ほかに Mudra Link
- ノーコードの「Mudra Studio」で、意図ベース・神経ベースのアプリを短時間で作り、他者と共有できる。意図とは何か、AI やロボティクスへの応用、AR との接点を論じたホワイトペーパーも公開(QR 配布)
「How BCI is Removing the Friction from AR and AI Interaction」セッションへの R&D 担当 藤原のまとめ
冒頭の「スライドを AI で作ろうとしたが、私の意図を理解しないからうまくいかなかった」というつかみが、この回の主張をそのまま言い当てていて見事でした。「意図とは、頭の中のワールドモデルと現実のズレを埋めようとする衝動だ」という定義付けは記憶に残りました。
そのうえで「言語は観測可能な振る舞いの最大 30% にすぎない。テキストだけに絞ると、共有できる意図が目減りする」という指摘は、テキスト中心で AI とやり取りしている私たちにとって、考えさせられる視点でした。
手の動きと発話が同じ脳領域から来ている、心拍と動きの同期が崩れると気が散っているのが分かる、といった話も具体的で面白かったです。生体センサーは今の私たちの仕事から遠いものの、「人の状態や状況をどう汲んで、出すものを変えるか」という問題意識は、まさに私たちが大事にしている発想と同じでした。
The View In 2036: How New Headmounted Devices and Always-On AI Will Change the Way We See the World(02:00 PM - 02:20 PM 視察:名村)
「The View In 2036:新しい頭部装着デバイスとAlways-On AIが世界の見え方をどう変えるか」のレポートをお届けします。
はじめに:本セッションの位置づけ
このセッションでは技術スタックやデバイスのアーキテクチャを論じるものではなく、10年後を見据えた設計倫理・普及条件・社会的ルールを主題とする未来構想型のトークでした。それでも、登壇者が「前提条件」として置いた論点の中に、弊社の従来の主張と構造的に一致するものがいくつもありましたので、その点を中心に整理します。技術発表ではなく「設計条件の変化」として読み解く——という弊社の従来のスタンスは、本セッションにおいても有効でした。
heads-downからheads-upへ:操作摩擦が消える世界
Harding氏の中心メッセージは、「heads-down(下を向く画面)からheads-up(前を向く画面)」への移行でした。スマートフォンを取り出し、ロックを解除し、アプリを開く——という複数の操作摩擦が、グラスでは視界に情報が現れ音声で応答する「フリクションレス」な体験に置き換わる、という見立てです。
ここで弊社が注目したのは、氏がAIとの関わり方そのものの転換を語った点です。こちらから問いを立てる「lean forward(前のめり)」から、状況・位置・気分に応じて情報が自動的に届く「lean back(後傾)」へ。ユーザーが質問しなくても情報が引き出される、という体験像です。氏はタイ料理店探しを例に、「20分以内・この価格帯」と声で伝えれば、他のグラスから得た混雑データまで含めて候補が返ってくる未来を描いていました。
「情報への到達経路が組み替わる」という弊社論点との一致
この「ユーザーに探させない」という発想こそ、弊社の視点から最も重要な接点でした。これは昨年度のAWEレポートで私たちが繰り返し述べた「ARは表現を変える技術ではなく、情報アクセスの構造を組み替える技術である」という論点と、ほぼ同じ方向を指しています。
従来のWebは「検索窓を探し、キーワードを入力し、結果一覧から選び、ページを読む」という探索行為を前提としてきました。しかし「探す・選ぶ・読む」が前提から外れたとき、Web側がどんな情報をどう公開すべきかが新たな争点になります。Harding氏の構想は技術論ではなく社会論として語られていましたが、結果として弊社の問題意識を別の角度から裏づける内容でした。情報が「状況と文脈を手がかりに自動的に引き出される」世界では、Webサーバーが公開すべき情報の設計思想そのものが問われることになります。
「より少なく、より良く」:情報を絞る設計思想
もう一点、強く印象に残ったのは情報の出し方を「絞る」設計思想です。Harding氏はAppleの通知グルーピング機能を引きながら、「より少ない情報を、より良く(less information and better information)」と述べ、文脈に応じて通知量を調整すべきだと主張しました。移動中や作業中は通知を絞り、ソファでくつろいでいるときは多めに通す——AIが状況を判断し、重要度で並べ替える、という考え方です。
これは弊社が「アクセシビリティは思想ではなく失敗回避の条件」として整理した観点と完全に重なります。視認性を高め、情報量を減らし、操作回数を減らす。
これは「優しさ」の話ではなく、操作の失敗や体験の中断という破綻を防ぐための、極めて現実的な設計判断です。常時表示デバイスでは「情報を足す」ことより「破綻させない」ことが前提になる——この認識が、技術者ではなく体験設計の専門家からも共有されている点は示唆的でした。WCAGやJIS X 8341で長年議論されてきた「認知負荷を下げる」「迷わせない」という原則が、AR時代にそのまま接続していく構図が見えます。
社会実装の課題:弊社主軸との距離と、わずかな接点
一方で、本セッションの大半は接続インフラの格差、価格、プライバシー、デジタルウェルビーイング、子どもの利用制限といった社会実装上の課題に割かれており、ここは弊社の主軸とは距離があります。インターネットを遮断する国の存在、先進国にも残る通信のデッドゾーン、子どもへの利用制限の必要性——こうした論点は重要ではあるものの、AR×Webの研究テーマとは直接交わりません。
ただ「接続性がなければグラスは顔に乗った一片のプラスチックに過ぎない」という氏の指摘は、通信インフラを前提条件として扱う弊社の論述(5G/6Gによるシンクライアント化)とも問題意識を共有しています。ハードウェア単体ではなく、それを支えるネットワークを「制約条件」として設計の前提に組み込む、という発想は一致していました。
まとめ:仮説を別方向から補強するレポートとして
総じて、製品やWeb融合の具体策を得るセッションではありませんでした。しかし、「情報アクセスの再設計」「情報を絞る設計」「インフラという制約条件」という、弊社の主軸を支える前提が、技術側ではなく社会・倫理側の議論からも立ち上がってくることを確認できた点に意味がありました。Webの上流設計(情報設計・運用設計)の知見が今後も優位性を持つ、という私たちの仮説を、別方向から補強するレポートとして位置づけます。
Optics Technologies Trends for the Next Generation of Smart Glasses(02:20 PM - 02:45 PM 視察:藤原)
登壇:Thomas Bithell(IDTechEx|市場調査アナリスト)/ Promenade Room 104B(XR Enablement トラック)/ 6/18 14:20〜14:45 / [公式](https://www.awexr.com/usa-2026/agenda/2247)
新興技術専門の市場調査会社 IDTechEx の Thomas Bithell が、次世代スマートグラスの光学技術(とくに導波路)の動向と、自社の市場予測を解説したセッション。会期中に何度か引用された「2036 年 3,500 万台」という市場規模の出どころでもある。
市場の現在地と「スマートグラスのための星」
いまは盛り上がりの時期。Google Glass の頃(2014〜2015 年)が過度な期待のピークでその後幻滅期、いまは緩やかに「生産性の安定期」へ上り始めている、という見立て。前夜の会話で出た「XR はマラソン、AI はスプリント」という言葉が印象に残った、と
普及に向け「星が揃いつつある」。①ソフト(Android XR、Horizon OS、Apple のシステム)、②ハードのサプライチェーン、③ユースケース。ある顧客は「4 つ目の星はフォームファクタで、まだ完璧ではない」と指摘したという
刺さるユースケース例として、脊椎手術で AI グラスを使うと成功率が 75% から 99% に上がり、麻酔が減り 1 日にこなせる手術が増える、という医療事例。自身が好きなサイクリングのナビ(ハンドルのスマホを見下ろさず前を見られる)も安全面で有望。最後は「コストに見合うか」が問われる
スマートグラス市場予測
立ち上がりの変曲点は 2027〜2028 年。独立系として現実的な数字を出しており、Meta の予測の約 10 分の 1 の規模で「それでよい」と考えている
導波路の見立ても辛口。ある向きは「2028 年に 1,000 万台」と言うが、IDTechEx は 300 万台程度とみる。なお視野角の「狭い/広い」は 30 度で線引きしており、もし 40 度を境にすれば「狭視野角」の比率は大きく変わる、と前提の置き方の重要性を強調
導波路とは何か:方式の整理
ざっくり、ディスプレイ → 投影光学系 → 光学コンバイナ(必ずしも導波路とは限らない)→ 全反射 → 目、という流れ。これに処方レンズや視線追跡カメラが乗る
- 導波路は、基板(屈折率が周囲より高い)に光を入れて全反射で運び、出力部から目へ出す。方式は回折(ナノ構造の回折格子)、反射(プリズム)、ホログラフィック(基本は屈折型。フォトポリマーをガラスで挟み、光の当たった所だけ化学反応で構造を埋め込む)など多様
非導波路のコンバイナ(XREAL が使う bird bath など)は、透明度などで何かを犠牲にしがちで、応用が限られる。トレンドは導波路へ向かう、とみる。なお会場を歩いて、Canon までガラス導波路をやっていると判明(ブースの別の担当者すら知らなかったほど裾野が広い)。Lumus のガラス導波路は Ray-Ban Display に採用
勝ち筋:反射型と SRG(表面レリーフ格子)
主要 3 タイプのうち、ホログラフィックは後退、反射型と SRG が支配的になると予測。bird bath にも居場所はある(安い)。データベース上の平均価格は、bird bath 機が約 550 ドル、導波路機が約 1,400 ドル。ただし 2020 年以降に限れば bird bath は約 550 ドルのまま、導波路機は約 800 ドルまで下がり、価格差は縮小している
反射型と SRG を合わせて、2036 年に市場の 73% を占めると予測。両者は競合しつつ共存し、一方が他方を駆逐するとは見ない
反射型の強み:波長に依存しない(色シフトが小さい)、回折より多くの光を反射でき光学効率が高い。SRG の強み:より薄く高画質なものが出てきており、ナノインプリントリソグラフィなど確立したウェハ工程で高歩留まり・低コストになりうる。一方ガラス反射型は多数のガラス片を切って磨いて貼るため歩留まりが低くコスト高。Optinvent は射出成形による反射導波路、Lumus は小型・軽量・安価な新シリーズを開発中
「物理は物理」:何もかもは最適化できない
どの方式にも長所と短所があり、最終的に何が良いかは用途次第。同じ導波路カテゴリ内でも重量や視野角の差が大きい。指標には実測(重量・厚み)と、本人が試着して評価した主観的なものが混在する
「physics is physics(物理は物理)」で、一つのパラメータを最適化すれば別の所を犠牲にする。実例として、視野角を上げると光学効率が大きく下がる。バッテリー寿命が大事なら視野角を諦める、という判断が要る(効率低下=発熱・電力増を避けるため)
基板:ガラスからポリマー、そして炭化ケイ素
基板はガラスが成熟・高画質だが、取材した各社はほぼ全員ポリマーを検討中。安く、安価な製法(射出成形)が使え、軽い。Cellid の導波路はガラス 9g/ポリマー 5g で、両眼で 10g 級の軽量化になりうる(装着感に大きく効く)。割れにくさの安全面も。屈折率はガラス約 2.0、最良のポリマーはそれに迫る水準
予測では、狭視野角ほどガラス → ポリマーの移行が速い。さらに上の高屈折率帯として炭化ケイ素(SiC、屈折率 2.5 まで)。Meta Orion(2024 年)が 45 度のフラット角で 70 度の広視野角を実現した例。ただし SiC は高価:ウェハが現状 6 インチ(ガラスは 8〜10〜12 インチ)で、1 枚から導波路が 4 つしか取れず歩留まりが悪い、ナノインプリントもまだ使えず工程が未成熟。当面は高価なままで、軍事・防衛など広帯域材料を要する高級帯に留まるとみる
「Optics Technologies Trends for the Next Generation of Smart Glasses」セッションへの R&D 担当 藤原のまとめ
導波路の方式から基板材料、コストや歩留まりまで、市場調査会社ならではの俯瞰で整理されたトラックでした。「2036 年 3,500 万台」「導波路は 2028 年に 300 万台」といった、楽観論を割り引いた数字を一次情報として聞けたのが収穫です。私に残ったのは「physics is physics(物理は物理)。一つのパラメータを最適化すれば別の所を犠牲にする」という指摘でした。
Bithell 氏は開発者ではなく市場を見るアナリストなので、ある立場を主張するというより、業界全体に共通する制約を事実として淡々と示してくれたという印象です。視野角を上げれば効率が落ちる、というように一つを立てれば一つが立たない以上、用途を先に決めてから何を諦めるかを選ぶという順番が要る。価格差がガラス導波路で約 1,400 ドルから 800 ドルへ縮んできている、ガラスからポリマー、さらに炭化ケイ素へという材料の階層がある、といった具体的な情報も、ハードの成熟度を見積もるうえで参考になりました。
OpenXR Deep Dive: From Runtime Architecture to Spatial Computing(03:00 PM - 03:25 PM 視察:藤原)
登壇:Frédéric Plourde(Collabora|XR Lead、兼 Khronos Group OpenXR ワーキンググループ アウトリーチ担当)/ Promenade Room 104B(XR Enablement トラック)/ 6/18 15:00〜15:25 / [公式](https://www.awexr.com/usa-2026/agenda/2179)
XR の標準仕様 OpenXR を、ランタイム構造から空間コンピューティングまで掘り下げたセッション。登壇者は Collabora の XR リードであり、Khronos の OpenXR ワーキンググループでアウトリーチを担う立場として登壇。世界を回って OpenXR の利点を伝えている、と前置きした。
OpenXR の成り立ちと到達点
発端は 2015 年。当時 XR の API は分断がひどく、2〜3 種類のデバイスを狙うと、それぞれ別の XR アプリを書く必要があった。Khronos に集まってワーキンググループを結成
2019 年(SIGGRAPH)に中核機能(入力・トラッキング)を備えた OpenXR 1.0 を公開。その後増えた拡張を中核仕様に取り込み、OpenXR 1.1、続いて 1.2 へ統合してきた
狙いは「一度書けばどこでも動く」アプリ。対応実装は年々・月々増え、標準的な VR/MR ヘッドセットに加え、シースルー光学のスマートグラス、3D 立体ディスプレイまで広がっている
ミドルウェアという盲点
この回の核心はミドルウェア。OpenXR を語るとき、上のアプリと下のランタイム(ランタイム A/B/C が自分の使う拡張・機能を支えるか)は意識されるが、間のミドルウェア層が忘れられがち、と指摘。「クロス開発でどこでも動く」とうたっても、現場では「ランタイム A で動いたアプリが B や C で動かない」ことが起きる
ミドルウェア層には XR フレームワーク、XR ライブラリ、そして多くの場合アプリが依存するゲームエンジン(Unity、Unreal のプラグイン等)が含まれる。Khronos が適合テストで「OpenXR 準拠」タグを与えるのは最下層のランタイムだけで、ミドルウェア層には適合という概念が存在しない、というのが落とし穴
さらに、OpenXR の拡張はグラフィックスバインディングの選択を除きすべて任意。つまり拡張を 1 つも実装しなくても適合テストは通りうる。加えてミドルウェア(エンジンやプラグイン)が、開発者の代わりに「どの拡張を使うか」を勝手に決めている場合がある。だから開発者は、自分のエンジン/プラグインが実際にどの OpenXR 拡張を使っているのかを把握する必要がある
Spatial Entity フレームワーク(空間コンピューティング)
6DoF トラッキングに加え、真に空間的な体験には、平面検知(テーブル・天井・床・壁)、画像認識(QR コード等で実世界に仮想コンテンツをアンカー)、コントローラ・ハンド・ボディトラッキングが要る
そこで比較的最近、Spatial Entity(空間エンティティ)フレームワークが登場。初版は 6 つの拡張で構成され、Spatial Anchor などが土台。平面トラッキング、QR・ビジュアルコード検出、そして配置した仮想コンテンツをセッションをまたいで残す永続化系の拡張もある(例:壁に貼った仮想 TV が、ヘッドセットを切って再訪しても残る)
それらはマルチベンダーの EXT 拡張で、広く採用されている証拠。新しい spatial bounds 系は、コンテンツを置いた壁の周辺だけにアンカー探索を絞り込む最適化。ハンドインタラクション拡張(aim/grip/pinch/pull)やジェスチャ対応もある
開発者向けの新しい道具
ベストプラクティス検証レイヤー。通常の検証レイヤーが API の不正使用でエラーを出すのに対し、これはエラーにせず、使い方が性能面で最適でない・将来の互換性問題につながりそうな箇所を警告・助言として返す。開発者は有効化すべき
入門用の GitHub チュートリアル(インスタンス作成 → グラフィックス統合 → 拡張の有効化まで段階的に学べる)
ミドルウェア・マトリクス(自己申告の対応表)
ミドルウェア層の不透明さを解くため、数か月前に「ミドルウェア・マトリクス」を公開。各 API・拡張について、各プロバイダ(エンジン/ライブラリ)が何を対応しているかを自己申告で示した対応表。ランタイム層で長年使ってきた形式を、ミドルウェア層にも用意したもの
まだ 5 プロバイダのみ。Call to Action として、OpenXR を使うミドルウェア提供者・ライブラリ(とくに活発な開発者コミュニティを持つところ)に参加を呼びかけた
質疑から:拡張が中核仕様になるまでの 4 段階
ハプティクスについては、過去に告知し関心は集めたが、まだ正式公開された拡張はない(参加・要望を募集中)
拡張の重複や昇格プロセスへの問いに対し、4 段階を説明。①ベンダー拡張(ベンダー略称付き。各社が自社ヘッドセットで先行実装)→ ②複数ベンダーが同じ概念を持ち寄り共通化した EXT(マルチベンダー拡張)→ ③ Khronos が批准した KHR(法的保護・保証が付く)→ ④中核仕様入り。中核に入ると拡張ではなくなり必須となり、CTS(Conformance Test Suite=仕様どおり動くかを確かめる公式の適合テスト)で検証される。適合ランタイムは中核仕様をすべて実装しないと適合を保てない
同じことをする単一ベンダー拡張が併存しても問題なく、いずれインターフェースとして統合されていく。passthrough(パススルー)系も複数の拡張・やり方があり、標準化の時期は明言できないが鋭意作業中、とした
「OpenXR Deep Dive: From Runtime Architecture to Spatial Computing」セッションへの R&D 担当 藤原のまとめ
OpenXR という標準の中身を、普段は見えないミドルウェア層まで踏み込んで説明してくれた、開発者向けの実のある回でした。「一度書けばどこでも動く、とうたっても、現場ではランタイム A で動いたものが B や C で動かない。原因は間のミドルウェア層にある」というのはよくある話だそうです。
標準があっても、エンジンやプラグインが裏でどの拡張を使うかを勝手に決めていて、しかもその層には適合という概念がない。だから自己申告のマトリクスで可視化する、という地道な取り組みは、標準化の難しさと誠実さの両方を感じさせました。
AWE USA 2026 Wrap-up and Best in Show Awards(03:45 PM - 04:30 PM 視察:名村)
AWE USA 2026の最終セッション「AWE USA 2026 Wrap-up and Best in Show Awards」(共同創設者Ori Inbar登壇)のレポートです。
このセッションは会期全体の総括と受賞発表となりました。
Best in Show(LBE部門、最もインパクトのある展示として選ばれた献血ブース、そしてSnapdragon)、XR殿堂入り、Virtual World Societyによる表彰など、内容の大半はコミュニティの祝祭としての性格が強いものです。
それでも、冒頭のOri氏によるまとめ基調には、当社の研究の文脈に接続できるメタ要素が含まれていました。本稿ではその点に絞って取り上げます。
ひとつは「I, Spatial(Humans Empowered by Spatial AI)」という枠組みです。Ori氏は、AIをめぐる本当のリスクは「仕事を失うこと」ではなく「エージェンシー(自ら判断し、進路を決める力)を失うこと」だと述べ、その回復策として空間コンピューティングとAIの統合を位置づけました。身につけたデバイス群が、AIによって人間の感覚を拡張し、AIエージェントを通じて世界に働きかける、という構図です。
これは当社が一貫して述べてきた、ARを「表現を変える技術」ではなく「情報アクセスの構造を組み替える技術」として読む視点と重なります。情報をどう見せるかではなく、情報への到達経路そのものをどう設計し直すか。Inbarの言うエージェンシーの回復とは、結局のところ「人間が情報とどう関わるか」の再設計に他なりません。
もうひとつは、彼が挙げた業界を動かす3つの潮流です。
- AIスマートグラスが現実世界におけるAIの優先インターフェースになりつつあること
- マートグラス向けアプリの爆発的増加
- AIがLLMからworld models(世界を真に理解するモデル)へ移行しつつあること
特に①と③は、当社の関心と直結します。カメラを搭載したデバイスが日常的に使われ、空間そのものを理解するモデルが情報を引き出すようになったとき、これまで「言語による検索」を前提としてきた情報到達のあり方は大きく変わります。その時、Web側はどのような情報を、どのような形でサーバーに公開しておくべきなのか。 これは当社が2025年度の総括でも提起した、今後の中核的な争点そのものです。
一方で、Ori氏が「coffee shop test(スマートグラスを人前で快適に着けられるか)」や、倫理・プライバシー・セキュリティを製品とビジネスモデルに組み込んだ者が長期的に勝つ、とこの開催2日目(当社が視察入りした日)のイベント開始時のキーノートで触れたことを改めて繰り返した点も重要でした。これは当社がかねて述べてきた、ハードウェアが「体験を拡張する装置」ではなく「設計に制約を与える前提条件」になったという認識と通底します。
総じて、このセッション自体は祝祭の場でしたが、その冒頭でAWEが掲げた「Spatial AI」という旗印は、ARを情報アクセスの再設計として捉える私たちの立場を、別の角度から裏づけるものでした。
以上、参加3日目のサマリーでした。
サービシンクでは今回の「AWE USA2026」には開催期間全て滞在して視察をしてきます。明日以降も当社の担当がみてきたものについては速報をお届けいたします。は速報をお届けいたします。
またのR&D活動はブログで定期的に公開していますので「ブログ−AR/VR/MR」カテゴリーをぜひご覧ください。
Webサイト・システムの
お悩みがある方は
お気軽にご相談ください
出張またはWeb会議にて、貴社Webサイトの改善すべき点や
ご相談事項に無料で回答いたします。
