๐ฐ Daily Digest โ 2026-03-17
7 items | DevTools, Business, Security, AI
๐ Quick Summary
How I Manage 10 Claude Code Agents Without Losing My Mind
Source: X (Artem Zhutov) ยท Category: DevTools ยท Link: Original
- Artem describes replacing tab-based parallel agent work with named terminal workspaces to reduce context loss and switching overhead.
- The workflow uses
cmux commands (list-workspaces, read-screen, send) so one orchestrator agent can monitor and coordinate multiple worker agents.
- He pairs the terminal setup with Obsidian session files and Bases dashboards to track status, enforce review, and relay feedback before marking work complete.
The visual shift: why words are losing
Source: X (Grant Lee) ยท Category: Business ยท Link: Original
- Grant argues communication bottlenecks come from the speed mismatch between thought (1,000โ3,000 wpm) and language output (speaking ~150 wpm, typing ~60โ90 wpm).
- The post cites visual-cognition evidence (13ms recognition, 90% visual input share, dual-coding memory effects) to argue visuals transmit meaning faster and with less loss.
- It claims AI is collapsing visual-production cost, shifting team communication from text-heavy artifacts toward faster visual-first alignment.
Nvidiaโs version of OpenClaw could solve its biggest problem: security
Source: TechCrunch ยท Category: Security ยท Link: Original
- Nvidia announced NemoClaw at GTC as an enterprise AI-agent layer on top of OpenClaw, framed around security and privacy controls.
- The platform is positioned as open source, hardware-agnostic, and compatible with multiple coding agents and models, including Nvidiaโs NemoTron family.
- Nvidia describes the release as early alpha with rough edges, signaling strategic urgency but incomplete production readiness.
Memories AI is building the visual memory layer for wearables and robotics
Source: TechCrunch ยท Category: AI ยท Link: Original
- Memories.ai is building visual-memory infrastructure so wearables and robots can index and recall video context rather than relying on text-style memory.
- The startup announced Nvidia collaboration using Cosmos-Reason 2 and Metropolis, and said it has raised $16M total.
- Its strategy combines model work (LVMM generations), data collection hardware (LUCI), and commercialization partnerships including Qualcomm.
OpenAI โadult modeโ ChatGPT article
Source: The Wall Street Journal ยท Category: AI ยท Link: Original
- The URL points to a Wall Street Journal piece about an OpenAI โadult modeโ topic for ChatGPT.
- โ ๏ธ Fetch failed (source returned
401 Unauthorized in available retrieval path).
- Detailed verification is pending until the full article becomes accessible.
Can LLMs Be Computers?
Source: Percepta.ai ยท Category: AI ยท Link: Original
- The post argues LLMs still fail at reliable long-horizon exact computation and proposes in-model execution instead of external tool handoffs.
- Percepta claims it built a computer inside a transformer that executes compiled program traces, with decoding optimized for logarithmic-time retrieval in its structured regime.
- Demo metrics in the article include a 10ร10 matching example streamed at ~34,867 tokens/sec on CPU, with claims of million-step execution.
Five categories of world models
Source: X (Zhuokai Zhao) ยท Category: AI ยท Link: Original
- Zhuokai frames recent funding momentum (AMI Labs $1.03B, World Labs $1B) as a signal that โworld modelโ now covers multiple distinct technical paradigms.
- The thread proposes five categories: JEPA, spatial-intelligence 3D models, learned simulation, physical-AI infrastructure, and active-inference systems.
- It emphasizes that architecture choices imply different trade-offs in data efficiency, controllability, deployment surface, and commercialization horizon.
๐ Detailed Notes
1. How I Manage 10 Claude Code Agents Without Losing My Mind
- The post starts with a concrete productivity failure mode: tab sprawl.
- Running many agents in browser tabs caused frequent context loss and confusion about which agent owned which task.
- Switching across anonymous tabs broke flow and made it hard to monitor long-running work.
- The author frames this as an operating-system problem, not just a prompting problem.
- The proposed fix is named, isolated terminal workspaces via
cmux.
- Each workspace represents a specific task lane (for example orchestrator, research, scripting, review).
- Workspaces are isolated from one another while still allowing multiple terminals per workspace.
- Hotkeys and stable names replace fragile mental mapping of โtab 4โ or โtab 7.โ
- Coordination is reduced to three programmable primitives.
cmux list-workspaces gives a machine-readable list of active contexts.
cmux read-screen lets an orchestrator inspect progress without interrupting worker execution.
cmux send enables asynchronous delegation and follow-up prompts across workspaces.
- The agent system is paired with explicit human verification loops.
- The author tracks each workspace as a session in Obsidian rather than relying on memory.
- Obsidian Bases dashboards auto-group sessions by status such as blocked, in-progress, done, and review.
- โDoneโ requires manual verification and comment feedback, which the orchestrator relays back to workers.
- The full workflow links planning, execution, and review in one control plane.
- A daily note defines intent, then sessions are spawned from that plan into workspaces.
- Progress and outcomes are inspected centrally, with comments routed back into the right task context.
- The claimed outcome is higher scalability and lower chaos for multi-agent personal operations.
2. The visual shift: why words are losing
- The core thesis is communication bandwidth mismatch.
- The post cites thought speed at roughly 1,000โ3,000 words per minute versus slower speaking and typing output rates.
- This gap is presented as structural friction in collaboration, especially when complex ideas must be serialized into text.
- The author positions modern interface shifts as repeated attempts to reduce this encoding bottleneck.
- Visual media is argued to outperform language on speed and retention.
- The post cites fast image recognition (13ms) and claims that most incoming information is processed visually.
- It references dual-coding theory to argue visuals create stronger memory traces than words alone.
- A โpicture superiorityโ argument is used to explain faster comprehension and better recall in team settings.
- Historical examples frame interfaces as progressive compression layers.
- The narrative runs from command line to GUI to shortcuts, each reducing interaction overhead.
- In social communication, emojis and lightweight visual cues are framed as compressed semantic carriers.
- The same pattern is applied to workplace tools where visual context can replace long textual explanation.
- Organizational evidence is used to argue practical business impact.
- The Challenger O-ring communication failure is cited as a cautionary example of weak data presentation.
- A Forbes-cited statistic in the post claims visuals speed consensus and reduce meeting duration.
- The claim is not that language disappears, but that visual structure determines whether language gets read.
- AI is framed as the catalyst that changes production economics.
- Historically, high-quality visual artifacts required specialized design resources and lead time.
- The post argues AI now lets teams produce infographics, briefs, and dashboards in minutes.
- The implied strategy is to treat visuals as a default operating medium for faster alignment.
3. Nvidiaโs version of OpenClaw could solve its biggest problem: security
- Nvidia positions NemoClaw as enterprise OpenClaw with governance hardening.
- Jensen Huang introduced NemoClaw at GTC as a response to rising enterprise agent demand.
- The framing compares OpenClaw strategy to earlier platform shifts like Linux, HTML, and Kubernetes.
- The message targets CEOs and platform teams, not just individual developers.
- Security and privacy are presented as the productโs core differentiator.
- TechCrunch describes NemoClaw as OpenClaw plus enterprise-grade controls baked in.
- Nvidia says companies can bring it up with one command and retain tighter behavior/data control.
- This aims to reduce a common blocker for deploying autonomous agents in regulated environments.
- The stack is designed for interoperability rather than lock-in.
- Nvidia says NemoClaw can work with multiple coding agents and open-source models.
- It is described as hardware agnostic, meaning it does not require Nvidia GPUs exclusively.
- Integration with Nvidiaโs NeMo suite and NemoTron models adds an optional native path.
- Launch status signals momentum with caution.
- Nvidia labels the release as early alpha and explicitly warns users to expect rough edges.
- The company says production-grade sandbox orchestration is a target state, not current reality.
- This indicates the strategic announcement is ahead of full enterprise operational maturity.
- The move sits inside a broader enterprise-agent platform race.
- The article references OpenAI Frontier and market interest in governance infrastructure.
- Gartner-style โagent sprawlโ concerns make policy and control layers newly valuable.
- NemoClaw is therefore both a product release and a strategic bid to shape enterprise standards.
4. Memories AI is building the visual memory layer for wearables and robotics
- The startup thesis centers on memory for physical AI.
- Founders from Metaโs Ray-Ban AI glasses effort saw a gap in recalling large volumes of captured video.
- They argue text-oriented memory methods are insufficient for embodied systems that perceive visually.
- The product goal is infrastructure for indexing and retrieving visual memories at scale.
- Nvidia partnership expands model and retrieval capabilities.
- Memories.ai announced collaboration at GTC using Cosmos-Reason 2 and Metropolis.
- The partnership supports reasoning over video and operational search/summarization pipelines.
- This ties the company to a larger physical-AI ecosystem rather than a standalone tool.
- Capital and business positioning are now clearer.
- TechCrunch reports $16M raised total, split between an $8M seed and an $8M extension.
- Named investors include Susa Ventures, Seedcamp, Fusion Fund, and Crane Venture Partners.
- Leadership says commercialization focus is on models/infrastructure while end markets mature.
- Data strategy combines custom collection with model iteration.
- The company introduced LVMM in 2025 and later shipped a second-generation version.
- It built LUCI devices for โdata collectorsโ to capture training video in preferred formats.
- Management says this hardware is for dataset quality and pipeline control, not hardware sales.
- Go-to-market appears partnership-led and phased.
- The team announced a Qualcomm partnership for processor deployment starting later in the year.
- It also claims ongoing work with major wearable companies without naming them.
- Near-term execution focuses on enabling infrastructure before mass wearable/robotics demand peaks.
5. Can LLMs Be Computers?
- The article defines a specific capability gap in modern LLMs.
- It acknowledges strong benchmark progress in higher-level math reasoning.
- It argues models still fail at reliable exact computation over long multi-step horizons.
- Sudoku and arithmetic reliability are used as examples of this unresolved weakness.
- The proposed solution is in-model execution, not external tooling.
- Percepta describes compiling arbitrary C programs into tokenized execution traces.
- A WebAssembly-style interpreter is implemented โinsideโ transformer behavior.
- The model executes steps directly in its own decoding stream rather than pausing for a tool call.
- The technical unlock focuses on decoding complexity.
- Standard autoregressive decoding cost grows with context because each step attends over long prefixes.
- The post claims a structured regime with head dimension 2 enables logarithmic-time retrieval/update behavior.
- This is presented as the key to scaling execution traces to very long horizons.
- Demonstrations are used to support feasibility claims.
- One example solves min-cost perfect matching on a 10ร10 matrix via Hungarian-style procedure.
- The article reports roughly 34,867 tokens/sec on CPU and continuous trace generation.
- It also claims strong Sudoku outcomes under this execution framework.
- The conceptual claim is about where computation lives.
- Tool use is framed as outsourcing execution to an external machine.
- In-model execution is framed as transparent, stepwise computation visible in the generated trace.
- The long-term implication is a model that can reason and execute in one integrated loop.
6. Five categories of world models
- The thread argues โworld modelโ has become an overloaded umbrella term.
- It opens with large funding signals (AMI Labs at $1.03B and World Labs at $1B).
- The author says investors and builders often use the same label for fundamentally different systems.
- A taxonomy is proposed to make comparisons more technically honest.
- Category one is JEPA-style latent predictive modeling.
- The thread cites V-JEPA 2 and AMI Labs as examples focused on latent prediction over pixel reconstruction.
- It highlights claims like 1.2B parameters, 1M+ hours of video pretraining, and 62 hours of robot data adaptation.
- The stated benefit is data-efficient physical reasoning and action-conditioned planning.
- Category two is spatial-intelligence world building.
- World Labs is presented as prioritizing persistent, editable 3D scene representations.
- The focus is explicit geometry and viewpoint consistency, not only next-frame prediction.
- This positions products closer to 3D creation and simulation environments.
- Category three is learned simulation for interaction and policy learning.
- Examples include Genie 3, Dreamer variants, and Runwayโs GWM framing.
- The shared goal is modeling action-conditioned dynamics over longer horizons.
- The thread notes convergence between generative world rendering and agent training loops.
- Categories four and five cover platform and inference paradigms.
- Nvidia Cosmos is described as physical-AI infrastructure across data, training, and deployment layers.
- Active inference (VERSES/Karl Friston lineage) is framed as object-centric Bayesian belief updating.
- The broader takeaway is that each category optimizes different trade-offs in realism, control, and product timing.
๐ฐ ๋ฐ์ผ๋ฆฌ ๋ค์ด์ ์คํธ โ 2026-03-17
7๊ฑด ์ ๋ฆฌ | DevTools, Business, Security, AI
๐ ๊ฐ๋จ ์์ฝ
How I Manage 10 Claude Code Agents Without Losing My Mind
์ถ์ฒ: X (Artem Zhutov) ยท ์นดํ
๊ณ ๋ฆฌ: DevTools ยท ๋งํฌ: ์๋ฌธ
- Artem์ ๋ณ๋ ฌ ์์ด์ ํธ ์์
์์ ํญ ๊ธฐ๋ฐ ์ด์์ ๋ฒ๋ฆฌ๊ณ ์ด๋ฆ์ด ์๋ ํฐ๋ฏธ๋ ์ํฌ์คํ์ด์ค๋ก ์ ํํด ์ปจํ
์คํธ ์์ค๊ณผ ์ ํ ๋น์ฉ์ ์ค์๋ค๊ณ ์ค๋ช
ํ๋ค.
- ์ด ๋ฐฉ์์
cmux ๋ช
๋ น(list-workspaces, read-screen, send)์ผ๋ก ์ค์ผ์คํธ๋ ์ดํฐ ์์ด์ ํธ๊ฐ ์ฌ๋ฌ ์์ปค ์์ด์ ํธ๋ฅผ ๋ชจ๋ํฐ๋งยท์กฐ์จํ๊ฒ ๋ง๋ ๋ค.
- ๋ํ Obsidian ์ธ์
ํ์ผ๊ณผ Bases ๋์๋ณด๋๋ฅผ ๊ฒฐํฉํด ์ํ ์ถ์ , ๊ฒ์ ๊ฒ์ดํธ, ํผ๋๋ฐฑ ๋ฆด๋ ์ด๋ฅผ ๊ฑฐ์น ๋ค ์๋ฃ๋ฅผ ํ์ ํ๋ค.
The visual shift: why words are losing
์ถ์ฒ: X (Grant Lee) ยท ์นดํ
๊ณ ๋ฆฌ: Business ยท ๋งํฌ: ์๋ฌธ
- Grant๋ ์ฌ๊ณ ์๋(๋ถ๋น 1,000
3,000๋จ์ด)์ ์ธ์ด ์ถ๋ ฅ ์๋(๋งํ๊ธฐ ์ฝ 150, ํ์ดํ ์ฝ 6090)์ ๊ฒฉ์ฐจ๊ฐ ์ปค๋ฎค๋์ผ์ด์
๋ณ๋ชฉ์ ํต์ฌ์ด๋ผ๊ณ ์ฃผ์ฅํ๋ค.
- ๊ธ์ ์๊ฐ ์ธ์ง ๊ทผ๊ฑฐ(13ms ์ด๋ฏธ์ง ์ธ์, ์๊ฐ ์
๋ ฅ ๋น์ค 90%, ์ด์ค๋ถํธํ ๊ธฐ์ต ํจ๊ณผ)๋ฅผ ๋ค์ด ์๊ฐ๋ฌผ์ด ๋ ๋น ๋ฅด๊ณ ์์ค์ด ์ ์ ์ ๋ฌ ์๋จ์ด๋ผ๊ณ ๋ณธ๋ค.
- ๋ํ AI๊ฐ ์๊ฐ๋ฌผ ์ ์ ๋น์ฉ์ ๊ธ๊ฒฉํ ๋ฎ์ถ๋ฉด์ ์กฐ์ง ์ปค๋ฎค๋์ผ์ด์
์ด ํ
์คํธ ์ค์ฌ์์ ์๊ฐ ์ค์ฌ์ผ๋ก ์ด๋ํ๋ค๊ณ ๋งํ๋ค.
Nvidiaโs version of OpenClaw could solve its biggest problem: security
์ถ์ฒ: TechCrunch ยท ์นดํ
๊ณ ๋ฆฌ: Security ยท ๋งํฌ: ์๋ฌธ
- Nvidia๋ GTC์์ NemoClaw๋ฅผ ๋ฐํํ๋ฉฐ OpenClaw ์์ ๋ณด์ยทํ๋ผ์ด๋ฒ์ ์ ์ด๋ฅผ ๊ฐํํ ์ํฐํ๋ผ์ด์ฆ ์์ด์ ํธ ๋ ์ด์ด๋ก ํฌ์ง์
๋ํ๋ค.
- ์ด ํ๋ซํผ์ ์คํ์์คยทํ๋์จ์ด ๋ถ๊ฐ์ง๋ก ยท๋ฉํฐ ์์ด์ ํธ/๋ชจ๋ธ ํธํ์ฑ์ ๋ด์ธ์ฐ๋ฉฐ NemoTron ๊ณ์ด๊ณผ๋ ์ฐ๋ ๊ฐ๋ฅํ๋ค๊ณ ์ค๋ช
๋๋ค.
- ๋ค๋ง Nvidia๋ ํ์ฌ๋ฅผ ์ด๊ธฐ ์ํ ๋จ๊ณ๋ก ๊ท์ ํ๋ฉฐ ์ ๋ต์ ์๋๋ ๋์ง๋ง ์์ ํ ํ๋ก๋์
์ฑ์๋๋ ์์ง์ด๋ผ๊ณ ์์ฌํ๋ค.
Memories AI is building the visual memory layer for wearables and robotics
์ถ์ฒ: TechCrunch ยท ์นดํ
๊ณ ๋ฆฌ: AI ยท ๋งํฌ: ์๋ฌธ
- Memories.ai๋ ์จ์ด๋ฌ๋ธยท๋ก๋ณดํฑ์ค๊ฐ ํ
์คํธํ ๋ฉ๋ชจ๋ฆฌ ๋์ ์์ ๋งฅ๋ฝ์ ์์ธยทํ์ํ ์ ์๋๋ก ์๊ฐ ๋ฉ๋ชจ๋ฆฌ ์ธํ๋ผ๋ฅผ ๊ตฌ์ถํ๊ณ ์๋ค.
- ํ์ฌ๋ Nvidia์์ ํ์
(Cosmos-Reason 2, Metropolis ํ์ฉ)์ ๋ฐํํ๊ณ ๋์ 1,600๋ง ๋ฌ๋ฌ๋ฅผ ์กฐ๋ฌํ๋ค๊ณ ๋ฐํ๋ค.
- ์ ๋ต์ ๋ชจ๋ธ(LVMM), ๋ฐ์ดํฐ ์์ง ํ๋์จ์ด(LUCI), ์์ฉ ํํธ๋์ญ(Qualcomm ํฌํจ)์ ํจ๊ป ๋ฌถ์ด ์คํํ๋ ํํ๋ค.
OpenAI โadult modeโ ChatGPT article
์ถ์ฒ: The Wall Street Journal ยท ์นดํ
๊ณ ๋ฆฌ: AI ยท ๋งํฌ: ์๋ฌธ
- ์ด URL์ ChatGPT์ โadult modeโ ๊ด๋ จ OpenAI ์ด์๋ฅผ ๋ค๋ฃฌ ์์คํธ๋ฆฌํธ์ ๋ ๊ธฐ์ฌ๋ก ์ฐ๊ฒฐ๋๋ค.
- โ ๏ธ ์์ง ์คํจ (์ ๊ทผ ๊ฐ๋ฅํ ๊ฒฝ๋ก์์
401 Unauthorized ๋ฐํ).
- ๋ณธ๋ฌธ ์ ๊ทผ์ด ๊ฐ๋ฅํด์ง ๋๊น์ง ์ธ๋ถ ๊ฒ์ฆ์ ๋ณด๋ฅ๋๋ค.
Can LLMs Be Computers?
์ถ์ฒ: Percepta.ai ยท ์นดํ
๊ณ ๋ฆฌ: AI ยท ๋งํฌ: ์๋ฌธ
- ์ด ๊ธ์ LLM์ด ๊ธด ์ฐ์ฐ ์ฒด์ธ์์ ์ ํ ๊ณ์ฐ์ ์์ ์ ์ผ๋ก ์ํํ์ง ๋ชปํ๋ค๋ ๋ฌธ์ ๋ฅผ ์ ๊ธฐํ๊ณ , ์ธ๋ถ ๋๊ตฌ ๋์ ๋ชจ๋ธ ๋ด๋ถ ์คํ์ ์ ์ํ๋ค.
- Percepta๋ C ์ฝ๋๋ฅผ ํ ํฐ ์คํ ํธ๋ ์ด์ค๋ก ์ปดํ์ผํด ํธ๋์คํฌ๋จธ ๋ด๋ถ์์ ์คํํ๋ ๋ฐฉ์์ ์ ์ํ๋ฉฐ, ๊ตฌ์กฐํ๋ ์กฐ๊ฑด์์ ๋ก๊ทธ ์๊ฐํ ์กฐํ ๊ฒฝ๋ก๋ฅผ ์ฃผ์ฅํ๋ค.
- ๋ฐ๋ชจ ์์น๋ก๋ 10ร10 ๋งค์นญ ๋ฌธ์ ๋ฅผ CPU์์ ์ด๋น ์ฝ 34,867 ํ ํฐ์ผ๋ก ์ฒ๋ฆฌํ๊ณ ๋ฐฑ๋ง ์คํ
๊ธ ์คํ์ด ๊ฐ๋ฅํ๋ค๋ ์ ์ ์ ์ํ๋ค.
Five categories of world models
์ถ์ฒ: X (Zhuokai Zhao) ยท ์นดํ
๊ณ ๋ฆฌ: AI ยท ๋งํฌ: ์๋ฌธ
- Zhuokai๋ AMI Labs(10.3์ต ๋ฌ๋ฌ)์ World Labs(10์ต ๋ฌ๋ฌ) ํฌ์ ์ฌ๋ก๋ฅผ ๊ทผ๊ฑฐ๋ก โ์๋ ๋ชจ๋ธโ์ด ์๋ก ๋ค๋ฅธ ๊ธฐ์ ๊ณ์ด์ ํฌ๊ดํ๋ค๊ณ ๋ณธ๋ค.
- ์ค๋ ๋๋ JEPA, ๊ณต๊ฐ์ง๋ฅ 3D ๋ชจ๋ธ, ํ์ต ์๋ฎฌ๋ ์ด์
, ๋ฌผ๋ฆฌ AI ์ธํ๋ผ, ์กํฐ๋ธ ์ธํผ๋ฐ์ค์ 5๊ฐ ๋ฒ์ฃผ๋ฅผ ์ ์ํ๋ค.
- ํต์ฌ ๋ฉ์์ง๋ ์ํคํ
์ฒ ์ ํ์ ๋ฐ๋ผ ๋ฐ์ดํฐ ํจ์จ, ์ ์ด์ฑ, ๋ฐฐํฌ ๋ฐฉ์, ์์ฉํ ์๊ณ์ด์ ํธ๋ ์ด๋์คํ๊ฐ ๋ฌ๋ผ์ง๋ค๋ ์ ์ด๋ค.
๐ ์์ธ ์ ๋ฆฌ
1. How I Manage 10 Claude Code Agents Without Losing My Mind
- ๊ธ์ ์ถ๋ฐ์ ์ ํญ ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ์ด์์ ์คํจ ์ฌ๋ก๋ค.
- ์ฌ๋ฌ ์์ด์ ํธ๋ฅผ ํญ์ผ๋ก ๋๋ฆฌ๋ฉด ์ด๋ค ํญ์ด ์ด๋ค ์์
์ธ์ง ๋น ๋ฅด๊ฒ ํท๊ฐ๋ฆฐ๋ค๊ณ ์ค๋ช
ํ๋ค.
- ํญ ๊ฐ ์ ํ์ด ์ฆ์์ง์๋ก ์ปจํ
์คํธ๊ฐ ๋๊ธฐ๊ณ ์์
ํ๋ฆ์ด ๋ฌด๋์ง๋ค.
- ์ ์๋ ์ด๋ฅผ ํ๋กฌํํธ ๋ฌธ์ ๊ฐ ์๋๋ผ ์์
ํ๊ฒฝ(์ด์์ฒด์ ) ๋ฌธ์ ๋ก ๋ณธ๋ค.
- ํด๊ฒฐ์ฑ
์ผ๋ก
cmux ๊ธฐ๋ฐ์ ์ด๋ฆ ์๋ ๊ฒฉ๋ฆฌ ์ํฌ์คํ์ด์ค๋ฅผ ์ ์ํ๋ค.
- ์ํฌ์คํ์ด์ค๋ง๋ค ์ค์ผ์คํธ๋ ์ดํฐยท๋ฆฌ์์นยท์คํฌ๋ฆฝํ
ยท๋ฆฌ๋ทฐ ๊ฐ์ ์ญํ ์ ๋ถ๋ฆฌํ๋ค.
- ์ํฌ์คํ์ด์ค ๊ฐ ์ปจํ
์คํธ๋ ๋ถ๋ฆฌํ๋ ๊ฐ ์ํฌ์คํ์ด์ค ๋ด๋ถ์์๋ ๋ค์ค ํฐ๋ฏธ๋์ ์ด์ฉํ๋ค.
- โํญ 4โ ๊ฐ์ ๋ชจํธํ ์๋ณ ๋์ ๊ณ ์ ๋ ์ด๋ฆ์ผ๋ก ์ ์ ์ ๋ถํ๋ฅผ ๋ฎ์ถ๋ค.
- ์กฐ์จ์ ์ธ ๊ฐ์ง ํ๋ก๊ทธ๋๋จธ๋ธ ๋ช
๋ น์ผ๋ก ๋จ์ํ๋๋ค.
cmux list-workspaces๋ก ํ์ฑ ์ปจํ
์คํธ ๋ชฉ๋ก์ ๊ธฐ๊ณ์ ์ผ๋ก ํ์
ํ๋ค.
cmux read-screen์ผ๋ก ์์ปค๋ฅผ ๋ฐฉํดํ์ง ์๊ณ ์งํ ์ํ๋ฅผ ์ฝ๋๋ค.
cmux send๋ก ์ํฌ์คํ์ด์ค ๊ฐ ์
๋ฌด ์ง์์ ํ์ ์ง์๋ฅผ ๋น๋๊ธฐ๋ก ์ ๋ฌํ๋ค.
- ์์คํ
์ ์ฌ๋ ๊ฒ์ ๋ฃจํ์ ๊ฒฐํฉ๋์ด ํ์ง ๊ฒ์ดํธ๋ฅผ ๋ง๋ ๋ค.
- ๊ฐ ์ํฌ์คํ์ด์ค๋ฅผ Obsidian ์ธ์
ํ์ผ๋ก ๊ธฐ๋กํด ์ํ๋ฅผ ์ธ๋ถํํ๋ค.
- Obsidian Bases ๋์๋ณด๋์์ blocked/in-progress/done/review๋ฅผ ์๋ ์ง๊ณํ๋ค.
- โ์๋ฃโ๋ ์๋ ๊ฒ์์ ์ฝ๋ฉํธ ๋ฐ์ ๋ค์๋ง ์ธ์ ๋๋ฉฐ, ์ค์ผ์คํธ๋ ์ดํฐ๊ฐ ์ด๋ฅผ ์ฌ์ ๋ฌํ๋ค.
- ์ ์ฒด ์ด์ ํ๋ฆ์ ๊ณํ-์คํ-๊ฒํ ๋ฅผ ํ๋์ ์ ์ด๋ฉด์ผ๋ก ๋ฌถ๋๋ค.
- ๋ฐ์ผ๋ฆฌ ๋
ธํธ์์ ์๋๋ฅผ ์ ์ํ๊ณ ์ธ์
์ ์์ฑํด ์ํฌ์คํ์ด์ค๋ฅผ ์คํฐํ๋ค.
- ์ค์์์ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ๊ณ ํผ๋๋ฐฑ์ ์ฌ๋ฐ๋ฅธ ํ์คํฌ ์ปจํ
์คํธ๋ก ๋ผ์ฐํ
ํ๋ค.
- ์ ์๊ฐ ๋งํ๋ ํจ๊ณผ๋ ์์ด์ ํธ ์๊ฐ ๋์ด๋ ํผ๋์ด ์ค๊ณ ํ์ฅ์ฑ์ด ๋์์ง๋ค๋ ์ ์ด๋ค.
2. The visual shift: why words are losing
- ํต์ฌ ๋ช
์ ๋ ์ฌ๊ณ ์๋์ ์ธ์ด ์ถ๋ ฅ ์๋์ ๋ถ์ผ์น๋ค.
- ๊ธ์ ์ฌ๊ณ ์๋(๋ถ๋น 1,000~3,000๋จ์ด)์ ๋ง/ํ์ดํ ์๋์ ๊ฒฉ์ฐจ๋ฅผ ์ ์ํ๋ค.
- ๋ณต์กํ ์์ด๋์ด๋ฅผ ํ
์คํธ๋ก ์ง๋ ฌํํ๋ ๊ณผ์ ์์ ๋ณ๋ชฉ์ด ์๊ธด๋ค๊ณ ๋ณธ๋ค.
- ์ธํฐํ์ด์ค ์งํ๋ ์ด ์ธ์ฝ๋ฉ ๋ณ๋ชฉ์ ์ค์ด๋ ์๋์๋ค๋ ํด์์ ์ ์ํ๋ค.
- ์๊ฐ ๋งค์ฒด๋ ์ ๋ฌ ์๋์ ๊ธฐ์ต ์ ์ง์์ ์ฐ์๊ฐ ์๋ค๊ณ ์ฃผ์ฅํ๋ค.
- 13ms ์์ค์ ์ด๋ฏธ์ง ์ธ์๊ณผ ์๊ฐ ์
๋ ฅ ์ค์ฌ ์ฒ๋ฆฌ ๋น์ค์ ๊ทผ๊ฑฐ๋ก ๋ ๋ค.
- ์ด์ค๋ถํธํ ์ด๋ก ์ ์ธ์ฉํด ์๊ฐ+์ธ์ด ๊ฒฐํฉ์ด ๊ธฐ์ต ํ์ ์ ๊ฐํํ๋ค๊ณ ์ค๋ช
ํ๋ค.
- ๊ฒฐ๊ณผ์ ์ผ๋ก ํ ์ปค๋ฎค๋์ผ์ด์
์์ ์ดํด ์๋์ ํ์ ์ ํ๋๊ฐ ๋์์ง๋ค๊ณ ๋ณธ๋ค.
- ์ญ์ฌ์ ์ธํฐํ์ด์ค ๋ณํ๋ โ์์ถ ๊ณ์ธตโ ๊ด์ ์ผ๋ก ์ค๋ช
๋๋ค.
- ์ปค๋งจ๋๋ผ์ธโGUIโ๋จ์ถํค์ ํ๋ฆ์ ๋์ผ ์์
์ ์ธ์ง/์
๋ ฅ ๋น์ฉ์ ์ค์ฌ์๋ค.
- ์ด๋ชจ์ง ๊ฐ์ ์งง์ ์๊ฐ ์ ํธ๋ ์ธ์ด๋ฅผ ์์ถํ ์๋ฏธ ์ ๋ฌ ์ฅ์น๋ก ํด์๋๋ค.
- ์
๋ฌด ๋๊ตฌ์์๋ ์๊ฐ ๋ฌธ๋งฅ์ด ๊ธด ์ค๋ช
๋ฌธ์ ๋์ฒดํ ์ ์๋ค๋ ๋
ผ๋ฆฌ๋ก ํ์ฅ๋๋ค.
- ์กฐ์ง ์ด์ ๊ด์ ์ ์ค๋ฌด์ ํจ์๋ ํจ๊ป ์ ์๋๋ค.
- ์ฑ๋ฆฐ์ ์ฌ๋ก๋ฅผ ๋ค์ด ๋ฐ์ดํฐ ํํ ์คํจ๊ฐ ์์ฌ๊ฒฐ์ ์คํจ๋ก ์ด์ด์ง ์ ์์์ ์๊ธฐ์ํจ๋ค.
- ๊ธ์์ ์ธ์ฉํ Forbes ํต๊ณ๋ ์๊ฐ ์๋ฃ๊ฐ ํฉ์ ์๋ยทํ์ ๊ธธ์ด์ ์ํฅ์ ์ค๋ค๊ณ ์ฃผ์ฅํ๋ค.
- ์ธ์ด๊ฐ ์ฌ๋ผ์ง๋ค๋ ์ฃผ์ฅ์ด ์๋๋ผ, ์๊ฐ ๊ตฌ์กฐ๊ฐ ์ธ์ด ์ฝํ ์์ฒด๋ฅผ ์ข์ฐํ๋ค๋ ๊ด์ ์ด๋ค.
- AI๋ ์๊ฐ ์ปค๋ฎค๋์ผ์ด์
๊ฒฝ์ ์ฑ์ ๋ฐ๊พธ๋ ์ด๋งค๋ก ์ ์๋๋ค.
- ๊ณผ๊ฑฐ์๋ ๊ณ ํ์ง ์๊ฐ ์ฐ์ถ๋ฌผ์ ๋ง๋ค๊ธฐ ์ํด ๋์์ธ ์ธ๋ ฅ๊ณผ ์๊ฐ์ด ํฌ๊ฒ ํ์ํ๋ค.
- ์ด์ ๋ ์ธํฌ๊ทธ๋ํฝยท๋ธ๋ฆฌํยท๋์๋ณด๋๋ฅผ ์งง์ ์๊ฐ์ ์ ์ํ ์ ์๋ค๊ณ ๋ณธ๋ค.
- ๋ฐ๋ผ์ ์กฐ์ง ๊ธฐ๋ณธ ์ด์ ๋งค์ฒด๋ฅผ ํ
์คํธ์์ ์๊ฐ ์ค์ฌ์ผ๋ก ์ฌ์ค๊ณํด์ผ ํ๋ค๋ ๊ฒฐ๋ก ์ผ๋ก ์ด์ด์ง๋ค.
3. Nvidiaโs version of OpenClaw could solve its biggest problem: security
- Nvidia๋ NemoClaw๋ฅผ ์ํฐํ๋ผ์ด์ฆ OpenClaw ๊ฐํํ์ผ๋ก ์ ์ํ๋ค.
- Jensen Huang์ GTC์์ ์ฆ๊ฐํ๋ ๊ธฐ์
ํ ์์ด์ ํธ ์์์ ๋ํ ํด๋ฒ์ผ๋ก ์ด๋ฅผ ์๊ฐํ๋ค.
- ๋ฉ์์ง๋ OpenClaw ์ ๋ต์ LinuxยทHTMLยทKubernetes ๊ธ ์ ํ๊ณผ ์ ์ฌํ๊ฒ ํ๋ ์ด๋ฐํ๋ค.
- ํ๊น์ ๊ฐ์ธ ๊ฐ๋ฐ์๋ณด๋ค CEO์ ํ๋ซํผ ์กฐ์ง์ ๊ฐ๊น๋ค.
- ์ฐจ๋ณํ ํฌ์ธํธ๋ ๋ณด์ยทํ๋ผ์ด๋ฒ์ ๊ฑฐ๋ฒ๋์ค๋ค.
- ๊ธฐ์ฌ์ ๋ฐ๋ฅด๋ฉด NemoClaw๋ OpenClaw์ ์ํฐํ๋ผ์ด์ฆ๊ธ ์ ์ด๋ฅผ ๋ด์ฅํ ํํ๋ค.
- Nvidia๋ ์์ปค๋งจ๋ ๊ธฐ๋๊ณผ ํจ๊ป ํ๋ยท๋ฐ์ดํฐ ํต์ ๋ฅผ ๊ฐํํ ์ ์๋ค๊ณ ์ค๋ช
ํ๋ค.
- ์ด๋ ๊ท์ ํ๊ฒฝ์์ ์์ด์ ํธ ๋์
์ ๋ง๋ ํต์ฌ ์ฅ์ ๋ฌผ์ ์ค์ด๋ ค๋ ๋ฐฉํฅ์ด๋ค.
- ์คํ์ ๋ฝ์ธ๋ณด๋ค ์ํธ์ด์ฉ์ฑ์ ๋ฌด๊ฒ๋ฅผ ๋๋ค.
- ์ฌ๋ฌ ์ฝ๋ฉ ์์ด์ ํธ์ ์คํ์์ค ๋ชจ๋ธ์ ์ฐ๊ฒฐํ ์ ์๋ค๊ณ ์ ์ํ๋ค.
- ํน์ GPU์ ์ข
์๋์ง ์๋ ํ๋์จ์ด ๋ถ๊ฐ์ง๋ก ์ ๊ฐ์กฐํ๋ค.
- ๋์์ NeMo ์ค์ํธ์ NemoTron ๋ชจ๋ธ๋ก ์์ฐ์ค๋ฌ์ด ์์ฌ ๊ฒฝ๋ก๋ ์ ๊ณตํ๋ค.
- ์ถ์ ์ฑ์๋๋ ๊ณต๊ฒฉ์ ๋ฐํ์ ์ ์คํ ์ด์ ์ฌ์ด์ ์๋ค.
- Nvidia๋ ์ด๊ธฐ ์ํ ๋จ๊ณ๋ก ๊ท์ ํ๋ฉฐ ๊ฑฐ์น ๋ถ๋ถ์ ๋ช
์์ ์ผ๋ก ๊ฒฝ๊ณ ํ๋ค.
- ํ๋ก๋์
๊ธ ์๋๋ฐ์ค ์ค์ผ์คํธ๋ ์ด์
์ ๋ชฉํ ์ํ๋ผ๊ณ ๋ฐํ๋ค.
- ์ฆ ์ ๋ต์ ์ ์ ์ ๋น ๋ฅด์ง๋ง ์ด์ ์์ฑ๋๋ ๋จ๊ณ์ ์ผ๋ก ์ฌ๋ผ๊ฐ๋ ๊ตฌ์กฐ๋ค.
- ์ด๋ฒ ๋ฐํ๋ ์ํฐํ๋ผ์ด์ฆ ์์ด์ ํธ ํ๋ซํผ ๊ฒฝ์ ๋งฅ๋ฝ์์ ์ฝํ๋ค.
- ๊ธฐ์ฌ์์๋ OpenAI Frontier์ ๊ฐ์ ๊ฒฝ์ ์์ง์์ ํจ๊ป ์ธ๊ธํ๋ค.
- ์์ด์ ํธ ์คํ๋กค ์ฐ๋ ค๊ฐ ์ปค์ง๋ฉด์ ์ ์ฑ
ยทํต์ ๋ ์ด์ด์ ๊ฐ์น๊ฐ ์์นํ๊ณ ์๋ค.
- NemoClaw๋ ์ ํ ์ถ์์ด์ ๊ธฐ์
ํ์ค ์ฃผ๋๊ถ์ ๊ฒจ๋ฅํ ํฌ์ง์
๋์ผ๋ก ๋ณด์ธ๋ค.
4. Memories AI is building the visual memory layer for wearables and robotics
- ํ์ฌ์ ์ถ๋ฐ ๊ฐ์ค์ ๋ฌผ๋ฆฌ AI์ ํ์ํ ๊ฒ์ โ์๊ฐ ๋ฉ๋ชจ๋ฆฌโ๋ผ๋ ์ ์ด๋ค.
- ์ฐฝ์
์ง์ Meta Ray-Ban AI ์๊ฒฝ ๊ฒฝํ์์ ๋๊ท๋ชจ ์์ ํ์์ ๊ณต๋ฐฑ์ ๋ดค๋ค๊ณ ๋งํ๋ค.
- ํ
์คํธ ์ค์ฌ ๋ฉ๋ชจ๋ฆฌ ๋ฐฉ์๋ง์ผ๋ก๋ ์๊ฐ ์ง๊ฐ ๊ธฐ๋ฐ ์์คํ
์ ํ๊ณ๊ฐ ์๋ค๊ณ ๋ณธ๋ค.
- ๋ชฉํ๋ ์์ ๊ธฐ์ต์ ๋๊ท๋ชจ๋ก ์์ธยท๊ฒ์ํ ์ ์๋ ์ธํ๋ผ ๊ตฌ์ถ์ด๋ค.
- Nvidia ํ์
์ ๋ชจ๋ธยท๊ฒ์ ์คํ ํ์ฅ์ ๋ท๋ฐ์นจํ๋ค.
- GTC์์ Cosmos-Reason 2์ Metropolis๋ฅผ ํ์ฉํ ํ์
์ ๋ฐํํ๋ค.
- ์ด๋ ๋น๋์ค ์ถ๋ก ๊ณผ ์ด์ ๊ฒ์/์์ฝ ํ์ดํ๋ผ์ธ์ ํจ๊ป ๊ฐํํ๋ ๋ฐฉํฅ์ด๋ค.
- ๋จ์ผ ์ ํ๋ณด๋ค ๋ฌผ๋ฆฌ AI ์ํ๊ณ ๋ด ํ๋ซํผ์ ์์น๋ฅผ ์งํฅํ๋ ํ๋ณด๋ค.
- ์๊ธ ์กฐ๋ฌ๊ณผ ์ฌ์
ํฌ์ง์
๋๋ ๋ณด๋ค ๋ช
ํํด์ก๋ค.
- TechCrunch๋ ์ด 1,600๋ง ๋ฌ๋ฌ ์กฐ๋ฌ(800๋ง ์๋ + 800๋ง ์ต์คํ
์
)์ ์ ํ๋ค.
- Susa Ventures, Seedcamp, Fusion Fund, Crane Venture Partners ๋ฑ์ด ํฌ์์๋ก ์ธ๊ธ๋๋ค.
- ๊ฒฝ์์ง์ ์์ฅ ์ฑ์ ์ ๊น์ง ๋ชจ๋ธยท์ธํ๋ผ ์ค์ฌ ์์ฉํ์ ์ง์คํ๊ฒ ๋ค๊ณ ๋ฐํ๋ค.
- ๋ฐ์ดํฐ ์ ๋ต์ ์์ฒด ์์ง๊ณผ ๋ชจ๋ธ ๊ณ ๋ํ๋ฅผ ๊ฒฐํฉํ๋ค.
- ํ์ฌ๋ 2025๋
LVMM์ ๊ณต๊ฐํ๊ณ ์ดํ 2์ธ๋ ๋ชจ๋ธ์ ๋ด๋จ๋ค.
- ํ์ต ์์ ์์ง์ ์ํด LUCI ์ฅ์น๋ฅผ ์์ฒด ์ ์ํด ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ์ ํต์ ํ๋ค.
- ์ด ํ๋์จ์ด๋ ํ๋งค ๋ชฉ์ ์ด ์๋๋ผ ๋ฐ์ดํฐ ํ์ง ํ๋ณด ๋ชฉ์ ์ด๋ผ๊ณ ์ค๋ช
ํ๋ค.
- ๊ณ ํฌ๋ง์ผ์ ํํธ๋์ญ ์ค์ฌ์ ๋จ๊ณ์ ์ ๊ฐ๋ก ๋ณด์ธ๋ค.
- Qualcomm ํ๋ก์ธ์ ๋์ ๋ฐฐํฌ ํํธ๋์ญ์ ์ฐ๋ด ์์ํ๋ค๊ณ ๋ฐํํ๋ค.
- ๋ํ ์จ์ด๋ฌ๋ธ ์
์ฒด๋ค๊ณผ ํ์
์ค์ด๋ผ๊ณ ๋ฐํ์ง๋ง ๊ตฌ์ฒด ๊ธฐ์
๋ช
์ ๋น๊ณต๊ฐ๋ค.
- ๋จ๊ธฐ์ ์ผ๋ก๋ ๋์ค ์์ ํญ๋ฐ ์ด์ ์ ๊ธฐ๋ฐ ์ธํ๋ผ ์ ์ ์ ์ง์คํ๋ ๋ชจ์ต์ด๋ค.
5. Can LLMs Be Computers?
- ๊ธ์ ์ต์ LLM์ ๊ณ์ฐ ๋ฅ๋ ฅ ๊ฒฉ์ฐจ๋ฅผ ๋ช
ํํ ์ ์ํ๋ค.
- ๊ณ ๋๋ ์ํ ์ถ๋ก ์ฑ๊ณผ๋ ์ธ์ ํ๋ฉด์๋ ์ฅ๊ธฐ ์ ํ ๊ณ์ฐ์ ์ทจ์ฝํ๋ค๊ณ ๋ณธ๋ค.
- ํนํ ๋ค๋จ๊ณ ์ฐ์ฐ์์ ์์ ์ฑ์ด ๋ฌด๋์ง๋ ๋ฌธ์ ๋ฅผ ํต์ฌ์ผ๋ก ์ ์ํ๋ค.
- ์ค๋์ฟ ยท์ฐ์ ์ ํ๋๋ฅผ ๋ํ์ ์คํจ ์ฌ๋ก๋ก ์ฌ์ฉํ๋ค.
- ์ ์๋ ํด๋ฒ์ ์ธ๋ถ ๋๊ตฌ ํธ์ถ์ด ์๋ ๋ชจ๋ธ ๋ด๋ถ ์คํ์ด๋ค.
- Percepta๋ ์์ C ํ๋ก๊ทธ๋จ์ ํ ํฐ ๊ธฐ๋ฐ ์คํ ํธ๋ ์ด์ค๋ก ์ปดํ์ผํ๋ค๊ณ ์ค๋ช
ํ๋ค.
- WebAssembly ์คํ์ผ ์ธํฐํ๋ฆฌํฐ๋ฅผ ํธ๋์คํฌ๋จธ ๋ด๋ถ ๋์์ผ๋ก ๊ตฌํํ๋ค๊ณ ์ฃผ์ฅํ๋ค.
- ์ฆ ํด ํธ์ถ๋ก ๋ฉ์ถ์ง ์๊ณ ๋ชจ๋ธ ๋์ฝ๋ฉ ๋ฃจํ ์์์ ์ง์ ์คํํ๋ค๋ ๊ฐ๋
์ด๋ค.
- ํต์ฌ ๊ธฐ์ ํฌ์ธํธ๋ ๋์ฝ๋ฉ ๋ณต์ก๋ ์ ์ด๋ค.
- ์ผ๋ฐ ์๊ธฐํ๊ท ๋์ฝ๋ฉ์ ์ปจํ
์คํธ๊ฐ ๊ธธ์ด์ง์๋ก ์ ๋๋ถ ์ฃผ์ ์ฐ์ฐ ๋ถ๋ด์ด ์ปค์ง๋ค.
- ๊ธ์ ํน์ ๊ตฌ์กฐ ์กฐ๊ฑด(ํค๋ ์ฐจ์ 2)์์ ๋ก๊ทธ ์๊ฐํ ์กฐํ/์
๋ฐ์ดํธ๊ฐ ๊ฐ๋ฅํ๋ค๊ณ ์ ์ํ๋ค.
- ์ด๋ฅผ ์ฅ๊ธฐ ์คํ ํธ๋ ์ด์ค ํ์ฅ์ ํต์ฌ ์กฐ๊ฑด์ผ๋ก ์ค๋ช
ํ๋ค.
- ๋ฐ๋ชจ๋ ์คํ ๊ฐ๋ฅ์ฑ ์ฃผ์ฅ์ ๋ท๋ฐ์นจํ๋ ๊ทผ๊ฑฐ๋ก ์ ์๋๋ค.
- 10ร10 ์ต์๋น์ฉ ๋งค์นญ ๋ฌธ์ ๋ฅผ Hungarian ๋ฐฉ์์ผ๋ก ํธ๋ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋ค.
- CPU ๊ธฐ์ค ์ด๋น ์ฝ 34,867 ํ ํฐ ์ฒ๋ฆฌ์ ์ฐ์ ํธ๋ ์ด์ค ์์ฑ์ ์์น๋ก ์ ์ํ๋ค.
- ์ค๋์ฟ ์์๋ ๋์ ์ ํ๋๋ฅผ ๋ณด์๋ค๋ ์ฃผ์ฅ์ผ๋ก ์ผ๋ฐ์ฑ์ ๋ณด๊ฐํ๋ค.
- ๊ฐ๋
์ ์ผ๋ก๋ โ์ฐ์ฐ์ด ์ด๋์์ ์ผ์ด๋๋๊ฐโ๋ฅผ ์ฌ์ ์ํ๋ค.
- ๊ธฐ์กด ํด ์ฌ์ฉ์ ์ค์ ๊ณ์ฐ์ ์ธ๋ถ ์์คํ
์ ์์ํ๋ ๋ฐฉ์์ผ๋ก ํด์ํ๋ค.
- ๋ด๋ถ ์คํ์ ์ค๊ฐ ๋จ๊ณ๊ฐ ํ ํฐ ํธ๋ ์ด์ค๋ก ๋๋ฌ๋๋ ํฌ๋ช
ํ ๊ณ์ฐ์ผ๋ก ๋ณธ๋ค.
- ์ฅ๊ธฐ์ ์ผ๋ก๋ ์ถ๋ก ๊ณผ ์คํ์ด ํ๋์ ๋ฃจํ์์ ๊ฒฐํฉ๋ ๋ชจ๋ธ์ ์งํฅํ๋ค.
6. Five categories of world models
- ์ค๋ ๋๋ โ์๋ ๋ชจ๋ธโ ์ฉ์ด๊ฐ ๊ณผ๋ํ๊ฒ ๋์ด์ก๋ค๊ณ ์ง๋จํ๋ค.
- AMI Labs(10.3์ต ๋ฌ๋ฌ), World Labs(10์ต ๋ฌ๋ฌ) ํฌ์ ์ฌ๋ก๋ฅผ ๋ฌธ์ ์ ๊ธฐ์ ์ถ๋ฐ์ ์ผ๋ก ๋๋ค.
- ๋์ผํ ์ฉ์ด๊ฐ ์ฌ์ค์ ๋ค๋ฅธ ๊ธฐ์ ์ฒด๊ณ๋ฅผ ๊ฐ๋ฆฌํค๋ ํผ์ ์ ์ง์ ํ๋ค.
- ์ด๋ฅผ ํด์ํ๊ธฐ ์ํด ๋น๊ต ๊ฐ๋ฅํ ๋ถ๋ฅ ์ฒด๊ณ๋ฅผ ์ ์ํ๋ค.
- 1๋ฒ ๋ฒ์ฃผ๋ JEPA ๊ณ์ด์ ์ ์ฌ๊ณต๊ฐ ์์ธก ๋ชจ๋ธ์ด๋ค.
- V-JEPA 2์ AMI Labs๋ฅผ ๋ํ ์ฌ๋ก๋ก ๋ค๋ฉฐ ํฝ์
์ฌ๊ตฌ์ฑ ๋์ ์ ์ฌ ์์ธก์ ๊ฐ์กฐํ๋ค.
- 12์ต ํ๋ผ๋ฏธํฐ, 100๋ง+ ์๊ฐ ๋น๋์ค ์ฌ์ ํ์ต, 62์๊ฐ ๋ก๋ด ๋ฐ์ดํฐ ์ ์ ๊ฐ์ ์์น๋ฅผ ์ธ์ฉํ๋ค.
- ํต์ฌ ์ฅ์ ์ ๋ฐ์ดํฐ ํจ์จ์ ๋ฌผ๋ฆฌ ์ถ๋ก ๊ณผ ํ๋ ์กฐ๊ฑด ๊ณํ ๋ฅ๋ ฅ์ผ๋ก ์ ์๋๋ค.
- 2๋ฒ ๋ฒ์ฃผ๋ ๊ณต๊ฐ์ง๋ฅ ๊ธฐ๋ฐ 3D ์๋ ๊ตฌ์ถ์ด๋ค.
- World Labs๋ ์ง์์ฑ ์๊ณ ํธ์ง ๊ฐ๋ฅํ 3D ์ฅ๋ฉด ํํ์ ์ฐ์ ํ๋ค๊ณ ์ค๋ช
๋๋ค.
- ๋จ์ ๋ค์ ํ๋ ์ ์์ธก๋ณด๋ค ๊ธฐํ ๊ตฌ์กฐ์ ์์ ์ผ๊ด์ฑ์ ์ค์ํ๋ค.
- ๊ฒฐ๊ณผ๋ฌผ์ ์์ ์์ฑ๋ณด๋ค 3D ์ ์ยท์๋ฎฌ๋ ์ด์
๋๊ตฌ์ ๊ฐ๊น๊ฒ ํฌ์ง์
๋๋๋ค.
- 3๋ฒ ๋ฒ์ฃผ๋ ์ํธ์์ฉยท์ ์ฑ
ํ์ต์ ์ํ ํ์ต ์๋ฎฌ๋ ์ด์
์ด๋ค.
- Genie 3, Dreamer ๊ณ์ด, Runway GWM์ด ๋ํ๋ก ์ธ๊ธ๋๋ค.
- ๊ณตํต ๋ชฉํ๋ ํ๋์ ์กฐ๊ฑดํ๋ ๋์ญํ์ ์ฅ๊ธฐ ๊ตฌ๊ฐ์์ ๋ชจ๋ธ๋งํ๋ ๊ฒ์ด๋ค.
- ์ค๋ ๋๋ ์๋ ๋ ๋๋ง๊ณผ ์์ด์ ํธ ํ์ต ๋ฃจํ๊ฐ ์ ์ฐจ ์๋ ดํ๋ค๊ณ ๋ณธ๋ค.
- 4ยท5๋ฒ ๋ฒ์ฃผ๋ ํ๋ซํผ/์ถ๋ก ํจ๋ฌ๋ค์์ ์ฐจ์ด๋ฅผ ๋ณด์ฌ์ค๋ค.
- Nvidia Cosmos๋ ๋ฐ์ดํฐยทํ์ตยท๋ฐฐํฌ๋ฅผ ํฌ๊ดํ๋ ๋ฌผ๋ฆฌ AI ์ธํ๋ผ ๊ณ์ธต์ผ๋ก ์ค๋ช
๋๋ค.
- Active Inference(VERSES/Friston)๋ ๊ฐ์ฒด ์ค์ฌ ๋ฒ ์ด์ง์ ์ ๋
๊ฐฑ์ ๊ณ์ด๋ก ๋ถ๋ฅ๋๋ค.
- ๊ฒฐ๋ก ์ ์ผ๋ก ๊ฐ ๋ฒ์ฃผ๋ ํ์ค์ฑยท์ ์ด์ฑยท์์ฉํ ํ์ด๋ฐ์ ์ต์ ์ ์ด ์๋ก ๋ค๋ฅด๋ค.