最終更新日:  公開日: AR・VR・MR

「XR」に関する世界最大のエキスポ「AWE USA2026」視察 速報サマリーNo.1

「XR」世界最大のエキスポ「AWE USA2026」視察 Day1 速報

こんにちは、サービシンクの名村です。
サービシンクでは2024年から「AR(拡張現実)」「MR(複合現実)」の可能性を探るためにR&Dを開始しています。またこれに「AR」「MR」に「VR(仮想現実)」を加えたものの総称として「XR」という言葉があります。

この「XR」の関する世界最大のエキスポ「AWE USA2026」が2026年6月15日 ~ 2025年6月18日、アメリカのロサンゼルスにある「Long Beach Convention Center」で開催されています。(AWE=Augmented World Expo)

2025年もこの「AWE USA」には視察に来ていますが、昨年は弊社の藤原だけだったものの、今回は代表の名村も同行して、2名で参加をしています。なお「AWE」は「アメリカ」「欧州」「アジア」で開催されており、2025年4月〜2026年3月の1年で、サービシンクはアメリカ、ベルギー、シンガポールの全イベントを視察してまいりました。
アメリカのAWE USA 2026で視察は2年目となります。

例年どおり弊社のR&Dは「Webの表現場所=ディスプレイは、いずれAR/MR空間へ移行する」という仮説の検証を目的としています。その視点で、今年の各講演、その中でも主にARに関する領域では、何が語られ、それが我々の関心領域である「WebサイトのAR表示」「Web技術との融合」にどう関わるかを整理します。

AWE USA2026 開催概要

会期 2026年06月15日 ~ 2025年06月18日
開催地 ロングビーチ / 米国 / 北米
会場 Long Beach Convention Center
出展対象品目 空間コンピューティング、クロスリアリティ(XR)、拡張現実(AR)、仮想現実(VR)、複合現実(MR)、AI、バイオインターフェース、ハプティクス、5G、ストリーミング、スタートアップ、投資
主催者 AWE XR, LLC
業種 情報・通信/通信、情報処理、コンピュータ
情報・通信/新聞、放送、映像(映画、フォト)
趣味・教育/玩具、遊戯用具、ゲーム用品
イノベーション・スタートアップ/イノベーション・スタートアップ
ウェブサイト https://www.awexr.com/usa-2026

開催は2026年6月15日からですが、初日はウェルカムパーティーなどが主でもあったので、セッションが具体的に開催される2026年6月16日より参加してきました。

2026年6月16日 視察セッション目次

  • AWE USA 2026 Welcome Keynote - I, Spatial – Humans Empowered by Spatial AI(AWE USA 2026 ウェルカム基調講演 ― 「I, Spatial(私は空間的存在)」空間AIによって拡張される人類)
  • Snap Keynote: Making Computing More Human(Snap 基調講演:コンピューティングをより人間的に)
  • Qualcomm Keynote: The Era of Personal AI and Endless Realities(Qualcomm 基調講演:パーソナルAIと無限のリアリティが拓く時代)
  • Google Keynote: Unifying the Android XR Ecosystem(Google 基調講演:Android XR エコシステムの統合)
  • How to Design Memorable XR Experiences Through Storytelling(ストーリーテリングで設計する、記憶に残るXR体験のつくり方)
  • Scaling LBE from Japan: From Places to Platforms(日本発でLBE(ロケーションベース・エンターテインメント)を拡大する ― 「場」から「プラットフォーム」へ)
  • Building for SPECS: Create What’s Next on Snap’s Developer Platform(SPECS向け開発:Snapの開発者プラットフォームで次の体験を創る)
  • Build Spatial Web with WebSpatial and AI accelerated Coding(WebSpatialとAI支援コーディングで構築する空間Web)
  • Building for the Android XR Ecosystem using Unity, Unreal, and Godot(Unity・Unreal・Godotで取り組むAndroid XR エコシステム開発)
  • The Sound of Smart Glasses: Bringing Voice AI into the Real World(スマートグラスの「音」 ― 音声AIを現実世界へ)
  • Bystander Signaling in the Era of AI Devices(AIデバイス時代の「周囲の人への意思表示(バイスタンダー・シグナリング)」)
  • From Eye Movements to User Context: Building More Personal AI Glasses with Inseye Tiny(視線の動きからユーザーコンテキストへ ― Inseye Tinyで実現する、よりパーソナルなAIグラス)
  • In Loving Memory of Reality(「リアリティ(現実)」への追悼)
  • From Web Browser to Metaverse Browser(Webブラウザからメタバースブラウザへ)
  • World Models Need a World(ワールドモデルには「世界」が必要だ)
  • PANEL: AI's Impact on Smart Glasses and Their Future(パネルディスカッション:AIがスマートグラスに与える影響とその未来)

AWE USA 2026 Welcome Keynote - I, Spatial – Humans Empowered by Spatial AI(09:00 AM - 09:25 AM 視察:名村)

セッションの主旨:「iRobot」か「iSpatial」か?

講演はやや挑発的な構成でした。冒頭、Ori Inbar氏は「ロボット」という言葉が1920年のチェコの戯曲『R.U.R.』で生まれ、語源がスラヴ語の「強制労働」であることを紹介します。そこから現在のAIへの過剰な期待と不安——研究者の警鐘、AIエージェントの暴走事例——へと話をつなぎ、「我々は岐路に立っている」と問題提起します。
Oriの主張の核は明快でした。勝者はAIで人間を最も置き換えた組織ではなく、人間とAIの協働が最も上手い組織である、と。そしてAIは人間を代替するのではなく、より高次の作業ができるよう「拡張(augment)」すべきだ、と。ここにOriは決定的な要素として「空間(spatial)」を加えます。人間は本来、空間的な生き物である。だからこそ空間コンピューティングとAIの融合こそが、人間を中心に置いたままAIと協働する最も自然な道だ——これが「Spatial AI/iSpatial」というメッセージでした。

「見せ方」ではなく「能力の付与」へ

私が最も注目したのは、Ori氏が語った今後の三つの大きな潮流です。

一つ目はフォームファクター。AIスマートグラスが普通の眼鏡と見分けがつかなくなり、現実世界でAIを使う標準的な手段になりつつあること。ただし「コーヒーショップ・テスト」、つまり他人の前で気兼ねなく着けられるかという社会的受容と、カメラ・表示・プライバシーのトレードオフが課題として残ること。

二つ目はコンテンツの爆発的増加。ハッカソンやスタートアップから日常向けのアプリが噴出しており、その加速要因が「バイブコーディング」、すなわちプロンプトを書けばAIコーディングエージェントがアプリを組み上げてしまう開発手法だという指摘です。氏自身、1998年以来コードを書いていないが数日でARアプリの試作を作れた、と語っていました。

三つ目、そしてOri氏が最大の地殻変動と呼んだのが、言語モデルから「世界モデル(World Models)」へのAIの進化です。世界の仕組みを学習したAIが、ロボティクスだけでなく空間AIに応用され、現実世界で人間に新しい能力を与える——というビジョンでした。

今回の基調講演を振り返って

ここで重要なのは、Ori氏が「AIに"物事を尋ねる"段階から、AIが"やり方を示してくれる"段階へ進む」と述べた点です。これは、私が前回のAWE Asia視察レポートで書いた「ARは表現を変える技術ではなく、情報アクセスの構造を組み替える技術になりつつある」という観察と完全に一致します。検索窓にキーワードを打つのではなく、対象に視線を向ければ必要な情報が引き出される。その世界において、我々Web制作者が問うべきは「Webサーバー側にどんな情報を、どんな構造で公開しておくべきか」です。

世界モデルとスマートグラスが融合し、現実空間そのものが情報の到達面になるなら、そこに表示されるコンテンツの更新性・正確性・文脈適応こそが勝負になります。これは新しい課題ではなく、Webが最初から向き合ってきた情報設計と運用設計そのものです。

一点、Ori氏のメッセージで強く共感したのは「専門知と経験を持つ人間が、これらのモデルを訓練し知識を移転した。その人々は報われるべきだ」という主張です。R&Dを通じて上流の情報設計・UX設計の知見を蓄えることが、AR時代においてもアドバンテージになる——その確信を改めて得た基調講演でした。


Snap Keynote: Making Computing More Human(09:30 AM - 09:55 AM 視察:名村)

    今回、最も注目していたセッションの一つ、Snap共同創業者兼CEO Evan Spiegel氏による基調講演「Snap's AR Glasses: Specs」を、Web視点で読み解いた一次情報のレポートです。

    「Phones to Specs」という主張

    Spiegel氏の主張の軸は明快で、「スマートフォンが私たちの生活をポケットに入れたのに対し、ARは生活が実際に起こる世界そのものにコンピューティングを置く」というものでした。彼は「下を覗き込む(look down into)デバイスから、顔を上げる(look up)コンピューティングへ」という言い方で、この移行を「phones to specs」と表現しています。

    製品「Specs」のスペックで押さえておくべき点

    • スイス製TR90ポリマー(同社の言う「プラスチックチタン」)製
    • 47mmフレームが約13.2g、52mmフレームが約13.6g
    • 液晶オンシリコン(LCoS)方式の独自光学エンジン
    • 髪の毛の先に1万個以上が載るというナノ構造の導波路(Waveguide)
    • 51度の視野角を実現。これは約3m先に置いた24インチデスクトップ、あるいは115インチのホームシネマ相当だと説明されました
    • Snapdragonを2基(コンピュータビジョン用とレンズ実行用)搭載
    • モーション・トゥ・フォトン遅延は7ミリ秒
    • 混在利用で最大4時間、充電ケース併用で計20時間
    • 価格は2,195ドルで、今秋出荷予定

    Vision ProやHoloLensが3,500ドル前後から始まったことを引き合いに、「最も高性能で最も装着可能なARグラス」を、より手の届く価格で出すという位置づけでした。この発表の時点から予約が始まりましたので、サービシンクとしても2台、購入予約を行いましたので、届きましたらレビューをさせていただきます。

    Web視点での着目点:開発フローが「作って終わり」から外れ始めた

    弊社の関心は、ハードのスペックそのものよりも開発・運用構造にあります。
    ここで最も注目したのは、Lens Studioに「エージェント型開発(agentic development)」が導入され、そのデベロッパープレビューがClaude Code・Codex・Cursorで提供開始された点です。

    さらにUnity等の既存資産をLens Studioへ移植する「migration agent」、C/C++ライブラリを持ち込めるネイティブ開発キット、Mapboxがナビゲーションエンジンを2時間未満で移植したという事例も示されました。

    これは弊社が昨年度の総括「AWEを世界中で見てきて確認したWeb視点で読み解いたARの現在地」で述べた、「AR体験は一度作って終わりでは成立しない/利用環境・入力・表示条件が変わり、生成AIによって作り直す・差し替える・組み替えることが前提になる」という見立てと、構造として一致します。AR開発が「特化アプリを一品ものでつくる」段階から、既存資産の移植・継続改善を前提とした運用構造へ移りつつある。これはまさにWebが最初から向き合ってきた運用の作法そのものです。

    もう一つの着目点:「intelligence that can see what you see」

    Spiegel氏は「チャットボックスに閉じ込められた知性ではなく、あなたが見ているものを見て、何をしようとしているかを理解し、その場で助ける知性」にこそ興奮すると語りました。OpenAIやGeminiのAPIを使い、現実を見て・理解して・応答するレンズの例として、視線の先に作業ガイドを出す「Handyman AI」が示されています。
    これは弊社が繰り返し述べてきた、ARが「表現を変える技術」ではなく「情報アクセスの構造を組み替える技術」である、という論点の延長線上にあります。

    ユーザーに「探す・選ぶ・読む」をさせず、状況と対象を手がかりに情報を自動で引き出す。その時、Web側は「どんな情報を、どんな構造でサーバーに公開しておくべきか」という問いに直面します。今回のSpecsが見せた方向は、この問いを一段現実に近づけたといえます。

    この注目セッションを総括

    このセッションで提示された開発・運用の前提を整理すると、更新性・移植性・継続改善という、Webが長年扱ってきた領域へ収斂していく流れが、昨年度より明確になっていると感じます。価格2,195ドルという設定も、過去の弊社のVision Pro分析で述べた「最終的には価格と製品サイズの問題になる」という見立てに沿った、普及フェーズを意識した一手です。
    弊社のビジョンである「Webの技術をリアルに広げる」という観点で見れば、Specsが示したのは、Web構築で培ってきた情報設計・UI/UX設計・運用設計という上流の技術資産が、AR空間でこそ効いてくるという確信を補強するものでした。


    Qualcomm Keynote: The Era of Personal AI and Endless Realities(10:00 AM - 10:25 AM 視察:名村)

    Qualcommキーノート 「The Era of Personal AI and Endless Realities」(登壇:Ziad Asghar / SVP & GM of XR, Qualcomm)を視聴しました。

    セッションのレポート:主役は「エージェント」へ

    キーノートを貫いていたのは、スペック自慢ではなく「情報の中心が入れ替わる」という宣言でした。これまではスマートフォンが情報の中心だったが、これからは仕事・医療・教育などバーティカルごとの「エージェント中心(agent-centric)の世界」になる。デバイスに「目と耳」を与え、見て・聞いて・推論し・行動させる。キーボードがPCを、タッチがスマホを成立させたように、AIとエージェントこそが次のヒューマン・マシン・インターフェースだ——という整理は明快でした。

    具体的な発表は、その「エージェントを載せる器」をいかに量産ラインに乗せるかに集約されていました。主なものは、

    1. スマホやクラウドにオフロードせずグラス上で4モデルを同時実行する世界初のオンデバイス・マルチモーダルAI
    2. 最小モジュールからソフト・量産パートナーまでをパッケージ化したターンキー開発キットSnapdragon Start program
    3. ガウシアンスプラッティングやリアルタイム画像生成まで担うMR向けSnapdragon Reality Elite
    4. Android XR × Google × Qualcommを土台にしたXreal Aura(70度視野・100g未満・本年秋出荷)の正式発表

    です。
    つまりこの日見せられたのは「新しい体験」ではなく、個人向けAIデバイスを量産可能なラインに乗せる土台の完成でした。

    サービシンクの関心領域との関連性への考察

    弊社が過去ブログで述べた「ARは表現の話から、情報アクセスの構造を組み替える技術へ移ってきている」という見立ては、今回の「エージェント中心」というメッセージと地続きでした。検索窓を開きページを開く従来の手続きを、エージェントとカメラ(環境理解)が肩代わりする。問われるのは「どう見せるWebサイトか」より、どんな情報をどんな粒度でWebサーバー側からエージェントに渡せるかです。

    また、スマートリングや音声・ジェスチャーが繰り返し強調されたのも象徴的でした。グラスは視界を占有しない前提で、入力は不安定。UI/UXは「リッチに見せる」のではなく「入力制約下でも破綻させない」方向に最適化される——弊社が「アクセシビリティは思想ではなく失敗回避の条件」と書いた論旨と一致します。Web側の情報構造とUXを、入力・表示の制約前提で再設計できる会社には、ここで大きなアドバンテージがあると考えます。

    そして、出口がリッチになるほど、その手前の「文脈が変わり続ける情報を素早く更新・差し替えできる母体」としてのWebの価値はむしろ再評価される、というのが現時点の読みです。サービシンクでは今後も「Web×AR」の可能性を追い続けます。


    Google Keynote: Unifying the Android XR Ecosystem(10:30 AM - 10:55 AM 視察:藤原)

    登壇:Juston Payne(Google)/ Hugo Swart(Google)/ Main Stage / [公式](https://www.awexr.com/usa-2026/agenda/2219)

    Google の Juston Payne と Hugo Swart による Android XR キーノート。中心メッセージは「その瞬間から人を引き離さずに、情報をより役立てる」。

    瞬間から引き離さない

    Gemini を搭載したグラスで、音楽機材のトラブルをその場で解決した逸話から始まった。Gemini のようなマルチモーダル AI がリアルタイムに見て・聞いて文脈を理解し、現実世界をデジタルキャンバスに変える、という。

    Android XR の3本柱

    1. context(開発が容易。Android の資産をそのまま流用し、端末種別に自動適応する。layouts・notifications・widgets を再利用)
    2. convergence(多様なデバイスがいずれ軽量グラスへ収束する。ただし当面は「カンブリア爆発」的に多様化する)
    3. continuity(世代をまたいで一貫した体験)

    「Android 向けに作っているなら、あなたはすでに Android XR 向けに作っている」という言い方で、既存スキルがそのまま活きる点を強調した。

    断片化と split compute

    Hugo Swart は platform fragmentation(プラットフォームの断片化)を規模拡大の最大の阻害要因とし、Samsung と 1 つのチームとして共通基盤で構築していると述べた。技術的には、split compute(頭から処理をパックへ逃がす)と optical see-through をメインストリームの本命とし、Snapdragon Reality Compute と Wi-Fi 7 で XREAL Aura を実現したと説明した。

    エージェントが代理で動く

    • 文脈理解の有無が「AI slop(一般論)」と個別最適を分ける(運動履歴から食事を提案、など)
    • Gemini の agentic action:DoorDash を裏で操作して卵を代理注文し、音声で最終承認する実演
    • ロードマップは Galaxy XR(2025 年 10 月)→ XREAL Aura → audio glasses(今秋、Gentle Monster/Warby Parker)

    「Google Keynote: Unifying the Android XR Ecosystem」セッションへの R&D 担当 藤原のまとめ

    別々に進化してきたヘッドセットとスマートグラスを、共通のプラットフォームと Gemini で束ねようとしている総合力は、やはり強いと感じました。ただ、Web 開発者として気になるのは、その「共通」の中身です。ヘッドセットは処理の重い体験も動かせて、アイトラッキングやハンドトラッキングといった操作もストレスなく使えますが、軽量なグラスでは同じようにはいきません。グラス上でどこまで複雑なアプリ動作を想定しているのか、それとも高度な操作はスマホやヘッドセットとの連携が前提なのか。その線引きが、まだ自分の中でははっきりしていません。今後の開発者向け情報や、実機での検証を通して確かめていきたいと思います。


    How to Design Memorable XR Experiences Through Storytelling(11:20 AM - 12:20 PM 視察:藤原)

    登壇:Eve Weston(Exelauno)/ モデレーター Scott Stein(CNET)/ Leah Rubin-Cadrain / Builders Stage(Creator)/ [公式](https://www.awexr.com/usa-2026/agenda/2016)

    VR シットコム「An Immersive Story」の作者 Eve Weston が、Scott Stein(CNET)の進行で、グラス/空間向けのストーリーテリングを論じたパネル(Leah Rubin-Cadrain も登壇)。

    グラスは別物のメディア

    最大の違いは視点(POV)。グラスは一人称が既定で、自分が見ているものを撮る。映画や TV の三人称とは根本的に異なる。別人のグラス視点へカットを割ると「自分が他人になる」ようで没入を壊し、酔いや混乱を招くため、意図的な「入れ替わり」物語以外では避けるべきだという。視点には視覚 POV に加え、ナラティブ・インタラクティブ性・社会的・AI の POV がある。

    文脈が最大の差別化要因

    「フレーム=見ているもの」になる以上、何が体験に関係し、何が関係しないかを設計で決める必要がある(部屋を認識して提案する、など)。すべてが関係するわけではない。設計を貫く問いは「私は誰か/どこにいるか/なぜここにいるのか」の 3 つで、とくに「なぜここにいるのか」はユーザーの意図を最優先に置く。

    AI 会話の設計教訓

    AI の NPC を会話的にするほどユーザーは雑談に留まり、ステージを進めるというゲーム本来の目的と真っ向から衝突した、という実例が紹介された。会話そのものが目的の体験(語学学習など)でこそ、AI 会話は活きるという。

    「How to Design Memorable XR Experiences Through Storytelling」セッションへの R&D 担当 藤原のまとめ

    デバイスやスペックの話が多い会期の中で、「体験を記憶に残すための設計」を物語の側から語っていたのは、とても新鮮でした。グラスでは一人称が既定になる、という指摘も、映像や体験を作る人にとっては発想の切り替えが要る話だと思います。とくに「私は誰か/どこにいるか/なぜここにいるのか」という三つの問い、なかでも「なぜここにいるのか」を最初に示すという原則は、XR に限らず、情報の見せ方全般に通じる考え方だと感じました。Web のページでも、結局は「この人がいま、なぜここを見ているのか」を捉えられるかどうかで、出すべき情報は変わってきます。物語の技法として語られていたことが、そのまま情報設計のヒントになる、という点がいちばん面白かったです。


    Scaling LBE from Japan: From Places to Platforms(12:25 PM - 12:55 PM 視察:名村)

    「LBEのプラットフォーム化」は、ハードウェア依存のAR体験がスケールしない問題への一つの回答

    視聴したセッション「Scaling LBE from Japan: From Places to Platforms」のレポートです。テーマはLBE(Location-Based Entertainment/施設・場所を活用した没入型エンタメ)を、日本からどうスケールさせるか、というものでした。

    なぜこのセッションに注目したのか

    私たちは前回のR&Dレポートで「なぜハードウェア依存のAR体験はスケールしないのか」という論点を整理しました。AWEで報告されるARの成功事例の多くは、利用場所が固定され、目的が単純で、体験時間が短く、再訪を前提としていない——つまり「問題が起きにくい条件・文脈を先に作っている」ケースだ、という見立てです。
    今回のセッションは、まさにその問題に対してSTYLY社が出した一つの回答でした。彼らの主張を一言でいえば、「個々の体験(場所)を作り込むのではなく、場所を“プラットフォーム”に変える」というものです。美術館がメディアになり、商業施設がプラットフォームになり、都市そのものが没入体験の基盤になる、と。これは個別最適な体験を増やすアプローチとは構造が違います。

    スケールを阻む「制作」と「運用」の2つのボトルネック

    興味深かったのは、彼らが語ったボトルネックが、表現力やコンテンツの完成度ではなかった点です。挙げられていたのは「制作」と「運用」という、極めて現実的な2つの障壁でした。
    制作については、STYLYは半年ほど前にAR/VR開発技術をオープンソース化したと述べていました。狙いは明快で、「クリエイターは体験の設計に時間を使うべきで、ネットワーキングや難しい技術処理に時間を使うべきではない」。実際、Unityでマルチプレイヤーのネットワーク同期を組むのは難しいため、ワンクリックでMeta Quest・Vision Pro・PICOといった各ヘッドセットに対応できるネットワークモジュールをOSSとして提供している、と。LBE特有の「他人とぶつからない」ための機能まで組み込まれている点が現実的でした。
    運用については、数百台規模のヘッドセットへのコンテンツ配信・起動管理を、ブラウザベースの管理コンソール(MDM)で解決するという話でした。これもOSS化されています。

    サービシンクの関心:これは「Webの運用構造」と同じ問題系である

    ここからが私たちの関心領域です。
    STYLYのアプローチを設計の観点で読み替えると、彼らがやっているのは「一度作って終わりではない体験」を、作り直し・差し替え・配信し続けられる構造に乗せることです。これは前回も書いた通り、ARに特有の発想ではなく、Webが最初から向き合ってきた運用構造そのものと一致します。
    体験を「制作(作る)」と「配信・運用(届け続ける)」のレイヤーに分け、制作者は表現に集中し、配信は仕組みが引き受ける——この分業の発想は、CMSやWeb配信基盤がたどってきた道筋と構造的に同じです。ARの世界は今、「特定の要素に特化したアプリ」でようやく動く段階から、汎用的な基盤の上にコンテンツが乗る段階へ移ろうとしている。ワープロソフトがWebベースのアプリへ移っていった過渡期に似た光景だと感じました。
    その意味で、「情報設計(IA)」と「配信・運用を前提とした設計」ができる人——つまりWeb制作が長年蓄積してきた知見は、LBEのスケール局面においても有効であり続ける、というのが今回の手応えです。一方で、IPコンテンツ活用(Attack on Titan、Ultraman等のKDDI連携事例)や創作支援の話も出ており、「誰が作るか」というクリエイター育成こそが最後のボトルネックだという指摘には、私たちも強く同意するところでした。


    Building for SPECS: Create What’s Next on Snap’s Developer Platform(01:00 PM - 01:25 PM 視察:名村)

    Snapによる基調セッション「Spectacles AR Upgrades / Lens Studio 5.0 / NDK / CLAW / Spatial Benchmark」を取り上げます。私たちの視察目的は終始一点で、AR領域が「Webサイトの表示」「Web技術の融合」とどう接続していくのか、という観点です。本稿もその視点から、製品紹介ではなく「設計条件がどう変わったか」として読み解いていきます。

    セッションの概要

    冒頭、Snapの共同創業者Bobby Murphy氏から新型ARグラス「Spectacles」のハードウェア刷新が示されました。表示領域は約30%拡大、本体は約40%軽量化、光学系の透過率は35%向上、そしてモーション・トゥ・フォトンの遅延を約半分の7ミリ秒まで削減した、という内容です。数字そのものより重要なのは、これらが「派手な体験を増やすため」ではなく「デジタルと現実を破綻なく重ねるため」の改善として語られていた点です。これは私たちがAWE Asia 2026で整理した「ハードウェアは体験拡張の主役ではなく、設計が守るべき制約条件の集合になりつつある」という見立てと、完全に同じ方向を向いています。
    そのうえで、セッションの主役は明確にソフトウェアでした。論点は大きく3つに整理できます。

    1. NDK(Native Development Kit)― 既存のネイティブ資産を「そのまま」空間に持ち込む

    最も注目したのがNDKです。これは開発者が既存のC/C++コードを、書き直しや変換を挟まずにLens Studioへ持ち込める仕組みです。OSへの低レベルアクセス、カメラ・GPS・ヘディングの直接取得、暗号処理を含む低レベルネットワーク、各種コーデックやマイクアクセスまで開放される、と説明されました。

    登壇したMapboxは、十数年かけて磨いたC++のロケーションエンジン(1日あたり3億マイル超の移動データを処理する規模)を、NDKのツールチェーンでLinux SDKを再コンパイルし、わずか2時間弱でSpectacles上にネイティブ動作させた、と語りました。後段では、ネイティブC++コードがそのままWebAssemblyへコンパイルされたことが「大きなマイルストーン」として言及されています。

    2. CLAW ― AIエージェントが開発の「ループ」を回す閉ループ・フレームワーク

    次にSpecsプロダクトチームから示されたのがCLAW(Closed Loop Agentic Development Framework)です。これは独立したAIチャット窓を後付けするものではなく、Lens StudioのMCPサーバーを介して、Anthropicの「Claude Code」、OpenAIの「Codex」、「Cursor」といった普段使いのコーディングアシスタントを直接つなぎ込む設計になっています。エージェントは「設計・プロトタイピング」「テスト・移行・最適化」「公開」「運用(post-production)」という4つのループに沿って、UI試作の生成、実機・シミュレータへのビルド投入、コンプライアンスやメタデータ整備、稼働中Lensのクラッシュ監視とパッチ準備までを担います。

    ここで強調されていたのが「CLAWは人間の判断を代替しない」という哲学でした。最終的な意思決定者は人間であり、エージェントは反復と定型作業を加速する存在だ、という線引きです。あわせて、サンドボックス化されたLens実行、カメラ等センサーアクセス時の明示的な同意とフロントLEDによる周囲への通知、リソース上限の強制、自動+人手のコンテンツモデレーションといった「プラットフォーム側の規律」がOSに組み込まれていることも示されました。

    3. Spatial Reasoning Benchmark ― モデルの空間能力を測る基準

    最後に、AIモデルの空間推論能力(座標幾何、空間レイアウト、階層構造など)を体系的に評価する「Spec Spatial Reasoning Benchmark」の初版が公開されました。主要モデルを実測した結果も同時に公表され、開発者がタスクに応じてモデルを選べるようにする狙いです。

    サービシンクの関心領域から見た意味

    ここからが私たちの本題です。このセッションは、私たちが過去の論述で立ててきた仮説を、いくつもの点で補完・強化するものでした。

    第一に、NDKとWebAssemblyへのコンパイルです。私は修士論文の段階から「ARデバイスが広がれば、Web Developerはこれまで作ってきた技術資産を空間で活用できる」と書いてきました。今回示されたのは、その「資産の移植」がまさに現実の開発フローとして動き始めたという事実です。十数年分のネイティブ実装が2時間で別プラットフォームに載る、しかもWebAssemblyという、本来Web技術の文脈で育ってきた実行形式を経由する。これは「既存のソフトウェアエコシステムとAR空間を橋渡しする」という発想が、抽象論ではなく具体的なツールチェーンとして提示された瞬間でした。表現先が空間へ移っても、積み上げてきた資産は捨てなくてよい——この方向性が一社の本気の投資として裏づけられたことは、私たちのR&Dにとって大きな意味を持ちます。

    第二に、CLAWが体現する「運用前提の開発構造」です。AWE Asia 2026で私は「AR体験は一度作って終わりでは成立しない。利用環境も入力方式も表示条件も変わり続ける以上、作り直す・差し替える・組み替えることが前提になる。これはWebが最初から向き合ってきた運用構造と一致する」と書きました。CLAWの4つのループ、とりわけ稼働中のLensを監視し続けてパッチを準備する「post-productionループ」は、まさにこの「作って終わりにしない運用」をエージェントで自動化する試みです。ARの開発が、単発の作品づくりから、継続的に保守・更新される情報サービスの運用へと移りつつある。その構造は、Web制作・Webシステム開発が30年向き合ってきたものそのものです。

    第三に、「人間が最終意思決定者である」という線引きと、ベンチマークの公開です。エージェントが定型を担うほど、人間の側に残るのは「何を見せ、何を見せないか」「どう情報へ到達させるか」という判断、すなわち情報設計(IA)とUX設計の上流です。AWE Asia 2026で「上流設計ができる人は今後も大きくアドバンテージを持つ」と書いた見立ては、ここでも補強されました。実装の参入障壁がAIで下がるほど、差がつくのは設計判断の質になります。

    今回のSnapのセッションは、AR開発が「特化アプリを職人芸で一本ずつ作る段階」から、「既存資産を移植し、AIエージェントで継続運用する段階」へ移ろうとしていることを、明確な製品とツールで示すものでした。ネイティブ資産がWebAssemblyを介して空間に流れ込み、Claude Code等のエージェントがMCP経由で開発ループを回す——この構図は、私たちが掲げてきた「Webの技術をリアルに広げる」というビジョン、そして「Webサイトの表現先は空間になっていく」という仮説に、また一つ具体的な裏づけを与えてくれました。

    一方で、これはまだ「プラットフォーム成立前夜」のツール群でもあります。実際に日常利用へ耐えるWeb×AR体験を成立させるには、表示の出し入れ、操作前提、情報アクセス構造といった設計上の摩擦点を、私たち自身が手を動かして検証していく必要があります。R&D活動を通じて、この観点をより強固なナレッジにしていきたいと思います。


    Build Spatial Web with WebSpatial and AI accelerated Coding(01:00 PM - 01:25 PM 視察:藤原)

    登壇:Ruoya Sheng(PICO)/ Pratik Thakare(PICO)/ Room 101A(Developer)/ [公式](https://www.awexr.com/usa-2026/agenda/2100)

    PICO の Ruoya Sheng(WebXR プロダクトマネージャ)と Pratik Thakare(開発者技術リード)が、オープンソースの WebSpatial を発表(進行は Meta の Benjamin Pointer)。中心は「2D の Web 開発者を、ゲームエンジンなしで空間(3D)へ」。

    なぜ「Web こそが道」か

    3D 開発は複雑で、HTML 要素を 3 次元へ引き上げる簡単な手段がなく、ネイティブ空間アプリにはダウンロードとアプリストアの壁がある。これに対し、Web には 3 つの強みがあるとした。

    1. 最大の開発者エコシステム(React/HTML)
    2. 17 億サイトの既存コンテンツを即・空間化できる
    3. アプリストア不要で、URL だけで届く

    「XR は 1% の専門的な 3D 開発者がボトルネックになっている。WebSpatial は残り 61% の Web 開発者を解き放つためにある」。

    主な機能

    • クロスプラットフォーム(同一コードのまま、一行も変えず PICO と Apple Vision Pro の両方で動く)
    • HTML 要素に z 軸を与え、3D で移動・回転・拡縮
    • model 要素で 3D アセットを画像と同じ感覚で埋め込み
    • 視線・ハンドジェスチャなどネイティブな空間操作、背景の透過

    AI で作る障壁を下げる

    スターターが CLAUDE.md/AGENTS.md/Codex を自動セットアップし、Trae(ByteDance の AI IDE)や Claude、Codex を使ってプロンプトから数回で生成できる、という実演も示された。WebSpatial は「単なるライブラリやフレームワークではなく、Web の未来への提案」と位置づけられ、W3C TPAC や BlinkOn で発表。Apple(spatial CSS/WebKit)や Microsoft とも対話を続けているという。

    「Build Spatial Web with WebSpatial and AI accelerated Coding」セッションへの R&D 担当 藤原のまとめ

    WebSpatial については、昨年のレポートや、その後の記事でも取り上げてきました。今回あらためて語られていたのは、3D アセットを埋め込む model 要素の紹介と、AI を用いた開発の話です。HTML のパーツをいったんバラバラにして、空間に再配置するという考え方は、実は PICO の発表を見る前から自分自身も考えていたことでした。だからこそ、共感する度合いがとても高いセッションでした。Web の延長線上で、特別な 3D エンジンを学ばずに空間 UI を組めるという点で、実用的で現実的なアプローチだと思います。引き続き、この路線は追いかけていきたいです。


    Building for the Android XR Ecosystem using Unity, Unreal, and Godot(01:40 PM - 02:05 視察:名村)

    先に正直に書いておきます。視察をしたものの、このセッションは弊社の主軸である「AR×Web」の文脈としては合致する部分は少なかった印象です。ですが、その視点を除いたセッションそのものの視察レポートとします。その上で、Web制作会社として読み替えられる論点が二つだけありましたので、後半で触れます。

    セッションの概要

    主題は、Unity・Unreal・GodotというゲームエンジンでAndroid XR向けの没入型アプリをどう開発するか、という開発者向けの技術紹介です。Android XRはAndroidエコシステムの拡張として位置づけられており、ディスプレイ付きグラスのような「augmented(拡張)」のデバイス群と、ヘッドセットのような「immersive(没入)」のデバイス群の二つに整理されていました。
    特に強調されていたのは、三大エンジンすべてに「day one」でAndroid XRのベンダー拡張が対応した点です。ハンドトラッキング、アイトラッキング、パススルー、フォービエイテッドレンダリング、フェイストラッキングといった機能が、エンジンごとにパッケージ化されて提供されます。Godotにいたってはヘッドセット上でGodotエディタ自体を動かし、その場で没入体験をプレビューできるという話もありました。
    加えて印象的だったのが「Direct Preview」というツールです。ヘッドセット開発では従来、ビルドして端末へ転送し、ログを見てPCへ戻す、という反復に時間を取られていました。Direct Previewはレンダリング結果をホストPCからヘッドセットへストリーミングし、OpenXRの各種入力を逆方向にPCへ返すことで、エディタ上で再生ボタンを押すだけで実機の挙動を確認できる、というものです。開発の反復速度を上げるという、地味だが実需に即した改善だと感じました。

    Web視点で読み替えられた、二つの論点

    ここからは、あくまで当社の関心に引き寄せた読み替えです。
    一つは、GoogleがSpatial Anchorsフレームワークを正式採用すると発表したことです。plane tracking・marker tracking・spatial anchorsをOpenXR拡張として標準化する、Qualcommやkhronosを巻き込んだクロスベンダーの取り組みで、Hopkins氏はこれを「portable spatial compute(可搬な空間コンピューティング)」と表現しました。要点は、ヘッドセット・グラス・スマートフォンという異なるフォームファクタを、単一のコードベースで横断できるようになる、という点です。これは当社が以前の総括ブログで述べた「単一コードで複数フォームファクタへ届ける」という発想であり、Webが当初から前提としてきた「一つのコンテンツを多様な画面へ最適化して配信する」という運用構造とそのまま重なります。
    もう一つは、標準的なAndroidアプリがXR空間内で「パネル」として、アダプティブレイアウトのまま表示されるという設計です。Chromeやメールを物理空間の好きな位置に配置できる「Home Space」と、全ピクセルを制御する没入用の「Full Space」が明確に分離されていました。既存の2Dアプリがそのまま空間へ持ち込まれるこの設計は、「WebサイトがAR空間に表示される未来」の、地味だが現実的な第一歩として読めます。

    まとめ

    繰り返しになりますが、本セッションはゲームエンジンによるネイティブXR開発の話であり、WebXRやブラウザ統合への直接の言及はありませんでした。その意味で「AR×Web」はまだ業界の主題には上がっていません。しかし標準化とクロスフォームファクタという足場が整いつつある今こそ、Web側の情報設計・UX設計の知見を持つ我々が関与する余地は大きいと考えています。当社では引き続き「Web×AR」の研究を進め、発表を続けていきます。


    The Sound of Smart Glasses: Bringing Voice AI into the Real World(01:35 PM - 02:00 PM 視察:藤原)

    登壇:Nik Jedrzejewski(NXP Semiconductors)/ Laurent Pilati(NXP Semiconductors)/ Brian Vogelsang(Google)/ Main Stage / [公式](https://www.awexr.com/usa-2026/agenda/2192)

    半導体メーカー NXP の Nik Jedrzejewski と Laurent Pilati が、スマートグラスの音声 AI(「見えない AI アシスタント」)を支える技術を語ったセッション(後半に Google の Brian Vogelsang が登壇)。中心は「音声が AI の主要なインターフェースになる/技術は徐々に消えていく」。

    画面からアンビエントな会話へ

    「通知が来ると、手を止め、スマホを取り出して見る。そうして注意は失われていた」。この画面中心の体験から、アンビエントで会話的な体験への移行を説いた。

    自然な会話を成り立たせる要素

    • backchanneling(相づち)と barge-in(割り込み)への対応
    • レイテンシ:質問と回答の自然な間合いは約 200 ミリ秒で、600 ミリ秒に達すると遅延として気づき不自然になる
    • 会話 AI は「端末で音声を捕捉 → ローカル処理 → クラウド → 耳へ返す」という cascade で、各段の最適化が要る

    NXP の技術

    • 3 本柱は、超低遅延、barge-in と文脈理解、エコー除去とノイズ低減
    • fixed beamformer(装着者の口元へズーム)と adaptive beamformer(周囲の話者向けで、翻訳に使う)で音響シーンを構成し、word error rate(単語誤り率)を最大 4 分の 1 に低減
    • 小型スピーカーの歪みには EAP(Essential Audio Processing)で対応。ハードは i.MX RT700 で、DSP・NPU・AI コプロセッサにより、常時音声を低電力ドメインで処理する。風切り音も AI で除去

    Google は Gemini アイウェアの音声処理で NXP と連携しているという。締めは「AI を誇示することが目的ではない。日常の体験から摩擦を取り除くために AI を使うのだ」「初めて、技術の側が私たちに適応し始めている」。

    「The Sound of Smart Glasses」セッションへの R&D 担当 藤原のまとめ

    このセッションで具体的に示されたのは、「自然な会話だ」と感じてもらうには、かなり短い応答速度が要る、ということでした。質問から答えまでの自然な間合いは約 200 ミリ秒で、600 ミリ秒に届くと、もう遅れとして気づかれてしまうそうです。音声を捕まえ、処理し、クラウドへ送り、また耳へ返す——その一つひとつにかかる時間が塵も積もって、応答までの「間」を生んでしまいます。だからこそ、各段階を地道に最適化していく必要がある。派手さはありませんが、こうした足元の積み重ねこそが体験の自然さを決めるのだと思います。表示の話に偏りがちなスマートグラス論の中で、「声」を主役に据えた視点も新鮮でした。


    Bystander Signaling in the Era of AI Devices(02:05 PM - 02:30 PM 視察:名村)

    Meta社のReality Labs Policy DirectorであるNathan White氏による「Bystander Signaling in the Era of AI Devices(AIデバイス時代における、周囲の人への合図)」というセッションです。トラックは「XR Policy」、つまり技術発表ではなく"社会の側のルール"を扱うものでした。
    このセッションを選んだ理由は明確です。サービシンクがR&Dの主眼に置いているのは、ARが「Webサイトの表示」「Web技術の融合」とどう接続していくか、という一点です。そしてその前段にある「そもそもARデバイスが社会に受け入れられるのか」という問いは、Web側がいくら準備をしても、デバイスが日常に存在しなければ意味がない、という土台の話だからです。

    セッションの中身:「何ができるか」ではなく「周囲の人がどう感じるか」

    White氏の主張は一貫していました。AIウェアラブルやスマートグラスの設計は、使う人(ユーザー)にとって便利かどうかだけでは決まらない。デバイスはユーザーの周囲の環境を処理する以上、その場に居合わせた「使っていない人」がどう感じるかが、技術の普及を左右する社会的な問題である、ということです。
    象徴的に語られたのが、カメラの歴史でした。携帯電話にカメラが載り始めた頃(最初に普及した1台として日本の京セラ「VP-210」が挙げられていました)、人々は「知らないうちに撮られるのではないか」と不安を抱いた。その不安に対して各キャリアが取った対応が、あの大きなシャッター音だったといいます。これは法律ではなく、社会に受け入れられるための"合図"として導入されたものであり、カメラ付き携帯が当たり前になると自然に消えていった、と。Metaがレンズに撮影中ランプを載せたのも、同じ系譜にある対応だと位置づけていました。
    そのうえで、White氏は現在を「過渡期」だと明言します。撮影ランプの意味が通じる地域もあれば、まだスマートグラス自体が珍しい地域もある。やがてデバイスはイヤホンやペンダント型にまで広がり、「ランプ」という合図そのものが通用しなくなる。だからこそ業界全体で、社会的受容のための共通のアプローチを作る必要がある、という呼びかけでした。
    質疑では「常時パッシブに録り続けるAIをどう扱うのか」「常時録画が前提の社会=パノプティコン化をどう考えるか」といった、踏み込んだ問いも出ていました。White氏の回答で私が最も重要だと感じたのは、人々の一番の懸念は"データセンターのどこか"ではなく"目の前の他人が何をしているか"であり、その情報の非対称性(相手が何をしているか分からない状態)こそ業界が乗り越えるべき壁だ、という整理でした。

    サービシンクの関心領域から見たとき

    ここからが本題です。このセッションは一見、Web制作とは無縁の「ポリシーの話」に見えます。しかし私の見方は逆です。
    サービシンクは過去のブログで、ARは「表現を変える技術」ではなく「情報アクセスの構造を組み替える技術」になりつつある、と述べてきました。カメラを向けるだけで、検索とナビゲーションが同時に成立する世界です。だとすれば、その入り口にあたる「ARデバイスが社会に受け入れられているか」が崩れれば、その先のWeb的な情報設計の議論は土台ごと成立しません。
    そしてWhite氏が語った「合図(signaling)」と「情報の非対称性の解消」は、突き詰めればこれは情報設計(IA)とユーザー体験(UX)の問題です。誰に、何を、どのタイミングで、どれだけ見せ/見せないかという設計判断であり、過剰な合図(常時点滅)は逆に意味を失う、という指摘は、私たちが日々Webの通知やインターフェースで向き合っている課題そのものでした。これは"ユーザー以外の人"にまで設計対象が広がった情報設計だ、と捉えると腑に落ちます。

    私はかねてより、ARが普及した世界では既存のWeb技術資産を「視界に情報を配置する」形で活かせる、と考えてきました。今回のセッションは、その普及の前提条件——社会的受容——が、技術ではなく設計と運用の問題として語られていたことを確認できた点で、収穫の大きいものでした。デバイスが社会に受け入れられて初めて、Webの情報がAR空間に出ていく議論が始まる。私たちが準備すべきは、まさにその「次の表示場所」に向けた情報設計の力だと、あらためて確信しています。


    From Eye Movements to User Context: Building More Personal AI Glasses with Inseye Tiny(03:45 PM - 04:10 PM 視察:藤原)

    登壇:Piotr Krukowski(Inseye Technologies)/ Builders Stage(XR Enablement)/ [公式](https://www.awexr.com/usa-2026/agenda/2216)

    Inseye Technologies の CEO Piotr Krukowski が、視線(アテンション)を読み取るコンテキスト認識スマートグラスを発表(25 人・3 大陸、Meta/Google/Samsung/Intel 出身のチーム)。

    スマホのように待ってはくれない

    スマホは見たいときに手に取って見るものだが、グラスは顔の上、視界の中に居座る。だから「ユーザーが見てくれるのを待つ」という前提が通用しない、と指摘した。いつ・どう見せ、次に何をすべきかをデバイス側が判断する必要があり、「時には、何も出さないのが最良のインターフェースだ」という。

    カメラを使わずに視線を読む

    - 常時オンの眼球運動コプロセッサ。赤外線イルミネータと単一フォトダイオードで眼球運動を取得(ヒンジやノーズパッドに収まる極小、100Hz で 10mW 以下)。カメラを使わず、プライバシーを守る
    - サッカード・瞬目・輻輳などの oculomotor events を抽出し、学習済み AI が行動状態(読書/視覚探索/集中・非集中/スマホ使用/会話)を推定(眼イベント検出 90%、読書検出 80%、5 秒未満で判定)

    視線=注意と意図の代理

    「視線を単なるマウスポインタとして扱うべきではない。注意と意図の代理指標として扱う」。gaze gesture で起動・確定・選択・一瞥ができる。実演では、試験勉強中は読書を検知して自動でサイレントにし、つまずきを検知したら表示の隅にそっとアイコンを出し、それを見つめると要約やブックマークが開く(すべて視線操作)。常時の眼球データはメンタルウェルビーイングの指標にもなるという。試作は展示中、評価キットは年内、量産 readiness は来年 Q2 の見込み。

    「From Eye Movements to User Context」セッションへの R&D 担当 藤原のまとめ

    印象的だったのは、視線の検出に「カメラではなく赤外線を使う」とわざわざ強調して、プライバシー上の安全性を説いていたことです。ここをあえて前面に出してくるあたり、プライバシーの問題が世間で本当に注目されているのだと、あらためて実感しました。スマホは見たいときに手に取って見るものですが、グラスは視界の中に居座るので、ユーザーが見てくれるまで待つ、という前提が成り立ちません。だからこそ、いつ出すか、いつ引っ込めるかを、デバイスの側が判断する必要があります。視線を単なるマウス代わりではなく、注意や意図の手がかりとして読む、という割り切りも面白いと思いました。必要がなければ何も出さない、という考え方は、情報の見せ方を考えるうえで、とても大事な視点だと感じます。


    In Loving Memory of Reality(03:50 PM - 04:15 PM 視察:名村)

    セッション概要

    セッションタイトルは「現実を偲んで(In Loving Memory of Reality)」。彼が2ヶ月前にロサンゼルスの墓地で開催した「現実の葬式」というイベントが起点になっています。AIや最適化されたSNSによって「何かが失われた」という感覚を多くの人が共有しており、見ず知らずの参加者同士が自分の生活を語り合う様子に、彼は強い手応えを得たといいます。

    彼の問題提起は明快でした。
    現在のSNSは、一部のインフルエンサーが投稿し、9割が黙って眺めるだけの構造になっている。フィードは広告と最適化で埋め尽くされ、新しさも発見もない。写真と動画はもはや「最適化され尽くした」メディアであり、ここから別のSNSを作っても curse(呪い)は解けない、と。

    そこで彼が提示した解が刺激的でした。写真・動画・リンク・テキストを一切アップロードできず、目の前の現実を50万個のパーティクル(Gaussian Splat)として「キャプチャ」することだけができるSNSです。空間そのものを丸ごと記録し、他人のキャプチャを自分の目の前の現実に「使う(using)」ことで融合させていく。投稿には必ず生身の人間が現場にいる必要があるため、構造上ボットが存在し得ない——この点を彼は強調していました。質疑では収益モデルにも触れ、「ベストケースは広告なしのProサブスクリプション」、そしてヘッドセットではなくスマートフォンでの体験を本命と位置づけていました。

    サービシンクの関心領域から見た考察

    ここからは弊社の関心、すなわち「Web制作とARの融合」という観点での読み解きです。正直に書きます。このセッションは、私たちのこれまでの仮説に真正面から異を唱える内容でした。

    私たちは2025年度の総括で「ARは表現を変える技術ではなく、情報アクセスの構造を組み替える技術であり、更新性・運用性を考えれば結果としてWebの技術に収斂していく」と述べました。ところがMalikの主張は逆方向です。彼が捨てようとしているのは、まさに写真・動画・テキスト・リンクというWebの基本フォーマットそのものだからです。

    この相違から、私が確認できた論点が二つあります。

    一つ目は、強く同意する点。彼の「ボットが構造上入り込めない」という設計思想です。生成AIによってコンテンツ生成コストがゼロに近づいた今、「その情報を誰が・どこで・本当に発したのか」という出自(lineage)の担保は、Webコンテンツの設計においても避けて通れない課題になります。彼が「キャプチャには必ず現場の人間が要る」という制約を出自証明の仕組みに転化していた発想は、Web側にも応用が効く視点だと感じました。

    二つ目は、Web制作会社として留保する点です。空間キャプチャは確かに魅力的な表現メディアですが、企業がWebに公開している情報の大半は「更新され、差し替えられ、検索され、再訪される」性質を持ちます。一度きりの空間キャプチャはこの運用要求に応えにくく、これは私たちが2025年度に「ハードウェア依存のAR体験はなぜスケールしないのか」で整理した課題と地続きです。彼自身も「平均的な人がタップだけで完結する単純さ」へ機能を削っていると語っており、表現の純度と日常運用の両立がまだ解けていないことを、当人が一番自覚しているように見えました。

    つまりこのセッションは、私たちにとって「答え」ではなく、良質な「反証」でした。AR時代の表現が必ずしもWebの延長線上に来るとは限らない——その可能性を、Webを生業とする私たち自身が直視しておく必要がある。そう突きつけられたという意味で、今回の視察で最も思考を動かされた1本でした。


    From Web Browser to Metaverse Browser(04:30 PM - 04:55 PM 視察:藤原)

    登壇:Sean Mann(RP1)/ Neil Trevett(Metaverse Standards Forum, NVIDIA, Khronos Group)/ Lori H. Schwartz(StoryTech)/ Room 101A(Developer)/ [公式](https://www.awexr.com/usa-2026/agenda/1972)

    RP1 の Sean Mann、Metaverse Standards Forum 会長の Neil Trevett(NVIDIA VP/Khronos Group 会長)、StoryTech の Lori H. Schwartz(進行)によるパネル(進行補助に Meta の Ben Higham)。Open Metaverse Browser Initiative(OMBI)と、オープンソースの空間ブラウザエンジン「SNEES」(Chrome のエンジン Blink のもじり)を発表した。

    「メタバース」を捉え直す

    VR に閉じこもる dystopian な像ではなく、スマートグラスで身のまわりの無数の空間サービスに Web 経由でアクセスする状態としてメタバースを再定義した。世界規模でこれを支える唯一の基盤が Web だという。現状の XR は各社の閉じたエコシステムで断片化している(iPhone 同士でしか電話できない世界、という喩え)。

    エンジンだけを 3D 対応にする

    ブラウザ全体を作り直すのではなく、「エンジン」だけを 3D 対応にアップグレードし、既存の Web 基盤に差す、という構想。WebXR は入出力の手段にすぎず宣言的でないとし、OMBI は「シーンを宣言すれば、実行時はブラウザが組み立てる」という declarative な 3D Web を提案する。

    企業の5つの譲れない条件と標準化

    企業にとっての譲れない条件の筆頭は「自分のデータを自分で所有すること」。ほかにゲートキーパーや壁庭園がないこと、全デバイス対応、制作の摩擦除去が挙げられた。標準化団体(Khronos/W3C/Open Geospatial Consortium など)が協働できる場として、Metaverse Standards Forum の下に OMBI を置き、今週オープンソースで公開。University of Rochester が議長を務める Open Metaverse Academic Alliance も発表された。「空間 Web の WordPress になれ」という呼びかけで締めくくられた。

    「From Web Browser to Metaverse Browser」セッションへの R&D 担当 藤原のまとめ

    冒頭で語られた、いまの「メタバース」の捉え方は間違っている、という指摘には、とても納得しました。VR の中に閉じこもる世界ではなく、スマートグラスで身のまわりの無数の空間サービスに Web 経由でアクセスする状態こそがメタバースだ、という捉え直しは、すんなり腑に落ちます。一方で気になるのは、「Web を空間へ」という方向はどの陣営も一致しているのに、その手段が WebSpatial、Apple の spatial CSS、そして今回の OMBI と乱立していて、まだ本命が見えないことです。作り手としては、どれか一つに賭けきるのではなく、出し方を差し替えられる構えで臨むのが現実的だろうと感じました。企業の譲れない条件の筆頭に「自分のデータを自分で所有する」を置く整理にも、深く頷きました。


    World Models Need a World(04:25 PM - 04:50 PM 視察:名村)

    正直に言えば、このセッションはWebサイト表示やWeb技術との融合を直接語るものではありませんでした。しかし、過去のAWE Asia 2026のレポートで私が整理した「ハードウェアは体験を拡張する存在ではなく、設計が守るべき制約条件の集合になった」という論点に、技術インフラの側面から強烈に接続する内容でした。

    セッションの主張:「知能(Intelligence)には存在(Presence)が必要だ」

    Ramirez氏の論旨は明快でした。いま業界はグラス、チップ、AIモデルに巨額の資金を投じているが、「そのコンテンツをどう届け、現実世界とどう相互作用させるか」を語る人がほとんどいない、という問題提起です。データセンターに閉じたWorld Modelは「より良いGoogleの一種」でしかなく、現実世界と接続して初めて意味を持つ。その接続レイヤーを9年かけて作ってきた、というのがMawariの主張でした。

    具体的には、AIアバターやデジタルヒューマンといった重い描画処理を、スマートグラスやスマートフォン側で処理するのではなく、ネットワークを介して分散配信する「split-compute(分散レンダリング)」が技術の核です。彼らは7件の特許を持ち、帯域を80%以上削減、motion-to-photonを30ミリ秒未満まで縮めたと述べていました。2019年のKDDI・AWSとの銀座でのAIガイド「Aiko」の事例から、2026年5月に稼働開始した約18万ノードのコミュニティ型ネットワークまで、実装の積み重ねが示されました。

    サービシンクの関心領域との接続:「物理法則がsplit-computeを強制する」

    ここが私の関心と直結した部分です。Ramirez氏は「チップがどれだけ良くなっても限界がある。押し込むほどバッテリーは死ぬ。すべては物理の問題であり、split-computeが唯一の方法だ」と断言しました。

    これは私が過去ブログで繰り返し書いてきたことと完全に一致します。2018年のブログでは「負荷になる処理はクラウドや手元のスマホにさせ、5G回線で飛ばし、グラス側は表示するだけ」という構想を述べました。2023年の修士論文抜粋記事では「6Gでシンクライアント化できる」と書きました。Mawariは、その構想を理論ではなく50以上の商用実装として成立させていた、ということになります。AWE Asia 2026で私が「ハードは制約条件になった」と整理した、その制約の最たるもの——電力と描画負荷——への現実解が、ここに提示されていたわけです。

    そして、もう一つ見逃せない論点がありました。Ramirez氏は「World Modelに最も不足しているのは、現実世界での行動とその結果のデータであり、それはXR体験を通してしか得られない」と述べました。アバターが現実の人間とどう相互作用し、それが機能したかどうか——この一次データこそ希少だ、と。

    これはWeb制作者にとって示唆的です。私はAWE Asia 2026のレポートで「ARはカメラを向けた行為がそのまま検索とナビゲーションを兼ねる、情報アクセス構造の組み替えだ」と書きました。だとすれば、その「向けられたカメラ」が拾う現実世界の文脈データをどう構造化し、どこに公開しておくのか、という問いは、Webサーバー側に公開すべき情報の設計、つまり我々の本業である情報設計(IA)の問題に必ず戻ってきます。配信インフラの話に見えて、その根は「文脈に応じて引き出される情報をどう持っておくか」という、Webが長年向き合ってきた運用構造そのものなのです。

    まとめ

    Mawariのセッションは、「Web融合」を直接語るものではありませんでした。ですが、AR体験が日常利用に耐えるための最大のボトルネック——描画負荷と電力——に対し、分散配信という現実的な解を商用レベルで提示していた点で、私のR&Dの仮説を技術インフラ面から補強する内容でした。同時に、彼らが自社IP(7月1日にエイベックスから公開予定のXRネイティブAIアーティスト)にまで踏み込んでいた事実は、「コンテンツ不在」というXRの長年の弱点を埋めにいく動きとして注目に値します。

    引き続きサービシンクでは「Web×AR」の可能性についてR&Dを続けていきます。


    PANEL: AI's Impact on Smart Glasses and Their Future(05:00 PM - 06:00 PM 視察:藤原)

    登壇:Tim Bajarin(モデレーター)/ John Iaia(Lenovo)/ Cortney Harding(Friends with Holograms)/ Ralph Jodice(XREAL)/ Craig Gray(Snap)/ Room 102A(AI + XR)/ [公式](https://www.awexr.com/usa-2026/agenda/1941)


    テック・アナリストの Tim Bajarin がモデレーターを務め、Lenovo・Friends with Holograms・XREAL・Snap の登壇者と「AI がスマートグラスに与える影響」を論じたパネル。

    AI がハード設計を反転させた

    「かつては、どれだけ画面を顔に貼れるかの競争だった。いまは AI が賢くなるほど、意図した体験に必要な最小限のハードは何か、を問う逆の発想だ」(Lenovo)。主戦場は装着性・重量・電池・終日着けられるかへ移っている。

    アプリからケイパビリティへ

    いまのスマホは孤立したアプリが並ぶだけで、互いに会話しない。これを、常時オンのエージェント AI を介して「すべてが通信する」ケイパビリティの集まりへ変えられないか、という見立てが示された。「アプリではなく、ケイパビリティを単位に見る」(Lenovo)。

    「載せる」から「その媒体のために作る」へ

    New York Times の最初の Web サイトは紙の新聞をそのまま載せただけだったが、やがて「その媒体のために作る」側へ移っていった。いまのグラスは「既存物を載せただけ」の段階で、本当の価値は「グラスでしか作れないものは何か」を問うた先にある(Harding)。

    AI の見せ方と運用

    • 「必要なときに使え、同じくらい邪魔せず引っ込む」責任ある実装(XREAL)
    • lean forward(こちらがプロンプトする)から lean back(AI が文脈から提案する)への移行。課題はトークンのコスト(token taxing)(Harding)
    • 締めは「AI は、人間の意図と機械の間にあった“記述する”段階を消していく。グラスは新しい画面ではなく、人と機械の翻訳の終わりであり、いずれ感覚の一部になる」(Lenovo)
    • 医療事例:XREAL Aura と日本の ISV が CT/MRI をハンズフリーで操作する例、Snap は会話の様子(ambient video)を電子カルテへ取り込む例

    「PANEL: AI's Impact on Smart Glasses and Their Future」セッションへの R&D 担当 藤原のまとめ

    「アプリからケイパビリティへ」「既存物を載せるのではなく、その媒体のために作る」という二つの指摘が、初日の総まとめのように響きました。とくに後者は、画面の幅で見た目を出し分けるレスポンシブの、その次に来る問いのように聞こえます。いまのグラスは、まだ手元にある資料や機能を「とりあえず載せてみた」段階にすぎません。本当の価値は、「グラスでしか作れないものは何か」を突き詰めた先にあるのだと思います。アプリという単位そのものを問い直し、常時オンのエージェントを介して機能どうしが連携していく、という見立ても刺激的でした。Web 制作を生業にしている立場からすると、ここはしばらく考え続けることになりそうなテーマです。初日の最後にふさわしい、視界の開ける議論でした。

    以上、参加初日のサマリーでした。
    サービシンクでは今回の「AWE USA2026」には開催期間全て滞在して視察をしてきます。明日以降も当社の担当がみてきたものについては速報をお届けいたします。

    またのR&D活動はブログで定期的に公開していますので「ブログ−AR/VR/MR」カテゴリーをぜひご覧ください。

    Webサイト・システムの
    お悩みがある方は
    お気軽にご相談ください

    出張またはWeb会議にて、貴社Webサイトの改善すべき点や
    ご相談事項に無料で回答いたします。

    無料相談・サイト診断 を詳しく見る

    多くのお客様が気になる情報をまとめました、
    こちらもご覧ください。