Loop là cái quái gì? — Peter Steinberger vs. Boris Cherny

Dòng tweet khiến timeline như bị bóp cổ

Một dòng tweet đã khiến cả timeline lập trình AI ám ảnh suốt tuần này. Peter Steinberger đăng nó ngày 7 tháng 6, nó đạt 2,2 triệu lượt xem, và các trả lời biến thành một trận ẩu đả về ý nghĩa thực sự của nó.

“Đây là lời nhắc hàng tháng của bạn: bạn không nên prompt các coding agent nữa. Bạn nên thiết kế những loop tự prompt các agent của bạn.”
— @steipete, 7 tháng 6, 2026

Đó là câu mọi người đang trích dẫn. Câu trả lời đáng chú ý nhất đến từ Varadh Jain, người đặt câu hỏi duy nhất quan trọng: điều này trông như thế nào trong thực tế? Và câu trả lời trở thành tâm trạng chung là của Matthew Berman.

“Không ai biết ngoài anh ấy và Boris.”
— @MatthewBerman, 7 tháng 6, 2026

Đó mới là câu chuyện thực sự. Không phải loop là tương lai, mà là một cụm sáu từ đạt hai triệu lượt xem trong khi những người chia sẻ nó tranh cãi trong phần trả lời về ý nghĩa của nó. Tôi không khinh thường, vì tôi chạy một loop mỗi đêm, mở pull request trên khoảng ba mươi kho mã nguồn mở trong khi tôi ngủ. Chín mươi giây nghiên cứu trả lại mười lăm luồng Reddit, hai mươi mốt bài đăng X, và một mô hình khó chịu: ý tưởng ồn ào nhất trong lập trình AI là thứ mà hầu hết những người đang lặp lại nó không thể giải thích. Một phe hét lên rằng prompt engineering đã chết. Phe còn lại, những người thực sự đặt tay lên bàn phím, thì thận trọng hơn.

“Không phải ralph/goal loops, thứ đó giờ đã cũ rích. Có lẽ là một dạng continuous orchestration loop nào đó giám sát các luồng/agent khác.”
— @trashpandaemoji, 7 tháng 6, 2026

Loop thực sự là gì

Boris Cherny tạo ra Claude Code như một dự án phụ vào tháng 9 năm 2024. Giờ đây nó được cho là đứng sau gần bốn phần trăm tất cả các commit công khai trên GitHub. Trên sân khấu tại sự kiện WorkOS Acquired Unplugged ngày 2 tháng 6, anh đưa ra định nghĩa rõ ràng nhất về loop mà bạn có thể tìm thấy.

“Bây giờ nó đã thực sự thăng cấp, tôi nghĩ, lên một làn sóng trừu tượng tiếp theo, nơi tôi không prompt Claude nữa. Tôi có những loop đang chạy. Chính chúng đang prompt Claude và tìm ra phải làm gì. Công việc của tôi là viết các loop.”
— Boris Cherny, WorkOS Acquired Unplugged, 2 tháng 6, 2026

Vậy đây là phiên bản đơn giản. Một loop là một chương trình nhỏ bạn viết để prompt coding agent thay mặt bạn, đọc những gì nó tạo ra, quyết định xem đã xong chưa, và nếu chưa thì prompt lại. Bạn ngừng là thứ bên trong loop đang gõ prompt. Bạn trở thành tác giả của loop. Mô hình trở thành một subroutine.

Ngừng là thứ bên trong loop.

Boris kể về ba giai đoạn, và việc tự đặt mình vào thang của anh ấy là cách nhanh nhất để hiểu. Một năm trước anh viết code bằng tay với tính năng tự động hoàn thành. Sau đó anh chạy năm đến mười phiên Claude song song và prompt từng cái. Giờ anh không prompt nữa. Anh viết các loop prompt Claude, và vài trăm agent đọc GitHub, Slack và Twitter của anh để quyết định xây dựng gì tiếp theo. Anh có bằng chứng.

“Trong 30 ngày qua, 100% đóng góp của tôi cho Claude Code được viết bởi Claude Code. Tôi đã merge 259 PR.”
— Boris Cherny, qua Simon Willison, 27 tháng 12, 2025

Anh đã xóa IDE vào tháng 11 và từ đó không mở lại. Sắc thái mà phe prompt-engineering-is-dead bỏ qua: anh không nói kỹ sư đã lỗi thời. Vẫn cần người quyết định xây dựng gì, nói chuyện với khách hàng, và phối hợp nhóm, và anh nói các kỹ sư giỏi quan trọng hơn bao giờ hết. Công việc không biến mất. Nó dịch chuyển lên một độ cao, từ viết code sang viết thứ viết code.

Phổ từ ReAct đến orchestration

Các câu trả lời rối rắm vì loop che giấu ít nhất năm thứ khác nhau. Đây là thang, từ cũ đến mới, để bạn ngừng nói lệch nhau.

Giai đoạn một là academic while-loop. Bài báo ReAct năm 2022 hệ thống hóa nó: mô hình suy luận, gọi công cụ, đọc kết quả, lặp lại cho đến khi xong. Một mô hình, một loop, một con người quan sát. Giai đoạn hai là AutoGPT năm 2023, cho nó một mục tiêu và để nó tự prompt chính mình, nổi tiếng vì quay vòng mãi mà chẳng làm gì. Thất bại đó gieo mầm cho câu nói “các agent chỉ là đồ chơi” kéo dài nhiều năm.

Giai đoạn ba là thứ Trash Panda gọi là cũ rích: ralph loop, do Geoffrey Huntley công bố tháng 7 năm 2025. Nó gần như xúc phạm vì đơn giản, một dòng bash đưa cùng một file prompt vào agent lặp đi lặp lại. Đổi mới thực sự của nó là kỷ luật: mỗi vòng lặp đặt lại ngữ cảnh về một tập file neo cố định thay vì để cuộc trò chuyện phình ra. Huntley đã xây dựng cả một ngôn ngữ lập trình với nó chỉ với khoảng 297 đô la. Giai đoạn bốn đưa nó thành sản phẩm: vào mùa xuân năm 2026 cả Codex và Claude Code đều ra mắt lệnh /goal, chạy ralph loop cho đến khi một mô hình xác nhận nhỏ xác nhận nhiệm vụ đã xong.

Giai đoạn năm là thứ Boris và Steinberger thực sự muốn nói, và nó thực sự mới, không chỉ là đổi tên. Bốn điều đã thay đổi. Loop trở thành đơn vị công việc, chứ không phải nhiệm vụ. Các loop bắt đầu giám sát các loop khác, đồng thời và theo lịch. Lập lịch thay thế việc khởi động của con người, nên loop chạy theo thời gian của hạ tầng thay vì sự chú ý của bạn. Và độ bền trở nên rõ ràng, với trạng thái được git hỗ trợ và khôi phục sau sự cố, vì những thứ này phải sống sót qua khởi động lại. Ralph giả định terminal của bạn luôn mở. Phiên bản 2026 giả định nó không. Vậy Trash Panda đúng hai lần: loop một agent kiểu ralph đã cũ, và loop orchestration đa agent ở trên nó mới là thứ mới.

Chỉ là cron job đội mũ

Dòng hoài nghi hay nhất trong toàn bộ văn kiện chỉ dài bốn từ, đăng dưới một bài gushing rằng loops là nơi mọi thứ sẽ đi.

“Cronjobs have funny re-branding rn.”
— Trả lời X, loops discourse, tháng 6 năm 2026

Điều này đáng được trả lời thẳng thắn, không né tránh, vì nó đúng một nửa. Đúng, lớp lập lịch là cron. Boris thực sự chạy loop của mình trên cron. Lệnh /loop trong Claude Code dùng cron bên dưới. Nếu định nghĩa loop của bạn chỉ là một thứ chạy theo định kỳ, thì đúng, chúng ta đã phát minh ra nó từ năm 1975 và bạn có thể về nhà.

Những gì cron chưa từng có là phần ở giữa. Một cron job chạy một kịch bản cố định. Một loop chạy một mô hình nhìn vào trạng thái hiện tại, quyết định làm gì tiếp theo, làm nó, kiểm tra xem có hiệu quả không, và quyết định có tiếp tục không. Quyết định thuộc về agent, không phải bạn, và không phải một nhánh mã hóa cứng. Xếp chồng chúng, để một loop điều phối và giám sát các loop khác, cho chúng trạng thái chia sẻ bền vững, và bạn có thứ mà cron không thể diễn đạt. Cách diễn đạt trung thực không phải loop là ma thuật mới và cũng không phải loop chỉ là cron. Mà là: loop là cron cộng với một người ra quyết định ở bên trong, và phần kỹ thuật thú vị là mọi thứ bạn bao quanh quyết định đó để nó không lao xuống vực.

Trông như thế nào khi bạn thực sự xây dựng một cái

Đủ lý thuyết rồi. Lối vào chỉ là một dòng. Claude Code ra mắt /loop, và ví dụ của Boris chính là khởi đầu kinh điển. Dán cái này vào và thay danh từ.

/loop trông nom tất cả PR của tôi. Tự động sửa lỗi build, và khi có bình luận, dùng một worktree agent để sửa chúng.

Và đây là công thức đầy đủ hơn của anh ấy. Vài ngày sau, Boris đăng năm lời khuyên để chạy Opus tự chủ trong hàng giờ hoặc hàng ngày.

“Năm lời khuyên, theo lời anh ấy: dùng chế độ tự động để cấp quyền, để Claude không hỏi phê duyệt; dùng dynamic workflows để Claude điều phối hàng trăm hoặc hàng nghìn agent để hoàn thành nhiệm vụ; dùng /goal hoặc /loop để nhắc Claude tiếp tục cho đến khi xong; dùng Claude Code trên đám mây để có thể đóng laptop; và đảm bảo Claude có cách tự xác minh công việc từ đầu đến cuối.”
— @bcherny, tháng 6 năm 2026

Lời khuyên thứ năm là thứ phe quảng cáo bỏ qua và phe thực hành ám ảnh: một loop chỉ đáng tin bằng khả năng tự kiểm tra công việc của chính nó.

Đó là toàn bộ ý tưởng thu nhỏ. Bạn không viết các bước. Bạn viết ý định và hành vi dừng, và loop prompt agent mỗi lần. Trên TikTok, cách diễn đạt này dễ hiểu với khán giả đại chúng.

“Loop mode là một trong những dấu hiệu rõ ràng nhất cho thấy lập trình AI đang chuyển từ one-off prompts sang hoạt động nền.”
— @ai.native.founder trên TikTok, tháng 6 năm 2026

Đầu sâu là Gas Town của Steve Yegge, ra mắt tháng 1: hai mươi đến ba mươi phiên Claude Code được điều phối bởi một Mayor agent, với các patrol agent chạy continuous loops và trạng thái lưu trong git để công việc sống sót sau sự cố. Đó chính là continuous orchestration loop giám sát các luồng khác mà Trash Panda đang hướng tới, đã được triển khai và mã nguồn mở.

Nhưng bài học thực tế nhất trong nghiên cứu là một loop chỉ tốt bằng khả năng tự kiểm tra của nó. Chủ đề phụ phát triển nhanh nhất không phải orchestration, mà là verification.

“Your coding agent can move fast, but bad commits compound fast too.”
— @DanKornas, tháng 6 năm 2026

Kornas đang phát hành roborev, một công cụ đánh giá mỗi commit trong nền và đưa kết quả trở lại agent trong khi ngữ cảnh vẫn còn tươi. Một loop mở chỉ viết code mà không có phản hồi là một cỗ máy tạo ra những sai lầm tự tin. Một loop viết, chạy, đọc kết quả và sửa là thứ thực sự hoạt động. Loop không phải phép màu. Phản hồi bên trong nó mới là.

Bước ngoặt: loop giờ là phần đắt đỏ

Đây là lúc nghiên cứu chuyển từ triết lý sang bài toán tài chính. Câu trả lời sắc bén nhất làm xì hơi toàn bộ thần thoại agent đến từ một kỹ sư đang làm việc.

“Every ai agent i shipped this year is a for-loop, an llm call, and a try/catch around the json parsing. The only thing agentic about it is the anthropic bill at the end of the month.”
— @rohit_jsfreaky, tháng 6 năm 2026

Hóa đơn đó không phải đùa. Biên lai của tháng: Uber giới hạn các kỹ sư của mình ở mức 1.500 đô la một người một công cụ một tháng cho Claude Code và Cursor sau khi đốt cháy ngân sách AI hàng năm trong bốn tháng. Một khi mô hình viết code gần như miễn phí, chi phí chuyển sang loop chạy nó.

“The costliest thing in AI coding is no longer writing code, it’s managing the agent loop.”
— @runes_leo, tháng 6 năm 2026

Và kiểu thất bại mà mọi người trong production sợ là loop không dừng lại.

“Without guardrails, you get infinite loops and billing surprises orders of magnitude over budget.”
— @cv_usk, tháng 6 năm 2026

Đó là lý do mọi bài viết nghiêm túc năm 2026 về loop đều hội tụ vào cùng ba điểm dừng cứng: số lần lặp tối đa, phát hiện không tiến triển, và giới hạn token hoặc ngân sách đô la. Phiên bản lãng mạn của loop là bạn viết loop và nghìn agent xây dựng công ty của bạn qua đêm. Phiên bản production là bạn viết loop, và phần lớn công việc của bạn là đảm bảo chúng dừng lại. Gartner đặt agentic AI ở đỉnh kỳ vọng thổi phồng, với chỉ khoảng mười bảy phần trăm tổ chức thực sự triển khai agent. Khoảng cách giữa timeline và biên lai chính là trạng thái thực tế.

Không phải loop. Mà là skill.

Đây là quan điểm của riêng tôi, và là nơi tôi đứng sau một tuần quan sát. Loop chỉ là đường ống. Tài sản là skill mà nó gọi.

Điểm lặp lại khác của Steinberger đi cùng với điểm về loop và là nửa bền vững hơn: nếu bạn làm điều gì đó hơn một lần, hãy biến nó thành một skill tự động, và nếu bạn làm điều gì đó khó, hãy biến nó thành skill sau đó để lần sau miễn phí. Một loop không có skill tái sử dụng bên trong chỉ là một while-true quanh một người lạ. Một loop gọi một thư viện các skill sắc bén, đã kiểm tra, có tên là một hệ thống kết hợp. Một người dùng Reddit đang thực sự chuyển đổi đã nói đúng nhất.

“A lot of people are rolling their eyes on Twitter, but my ears are perked up.”
— r/ChatGPTCoding, tháng 6 năm 2026

Vậy câu trả lời cho WTF là loop không phải một phát ngôn gây sốc rằng prompt engineering đang chết. Mà là: ngừng là thứ bên trong loop. Viết loop một lần, trang bị cho nó các skill đáng gọi và phản hồi để nó tự kiểm tra, giới hạn nó để nó dừng lại, và để nó chạy trên cron trong khi bạn đi quyết định xây dựng gì tiếp theo. Steinberger và Boris đang mô tả cùng một con vật từ hai phía. Chỉ những người đã xây dựng một cái mới thực sự biết. Tin tốt là, kể từ tháng này, lối vào chỉ là một lệnh gạch chéo duy nhất.

Các mẫu chính từ nghiên cứu

Một loop là cron cộng người ra quyết định bên trong: mô hình, không phải nhánh mã hóa cứng, chọn hành động tiếp theo mỗi lần.

Dòng dõi là có thật: ReAct năm 2022, AutoGPT năm 2023, ralph năm 2025, /goal mùa xuân 2026, orchestration loops bây giờ. Loop ralph một agent đã cũ; giám sát đa agent là lớp mới.

Loop chỉ tốt bằng phản hồi của nó. Đánh giá liên tục và các cổng xác nhận là thứ làm cho loop đáng tin.

Tài nguyên đắt đỏ đã chuyển từ token sang quản lý loop. Giới hạn số lần lặp, phát hiện không tiến triển, đặt ngân sách đô la.

Đơn vị tái sử dụng bên trong loop là skill, không phải prompt. Các loop gọi skill có tên sắc bén thì kết hợp; các loop tự suy diễn lại mọi thứ chỉ đốt tiền.

Tất cả agent đều báo cáo lại

Reddit: 17 giọng nói (r/ClaudeAI, r/AI_Agents, r/ExperiencedDevs), 47 luồng, 34k upvote. X: 21 giọng nói (steipete, bcherny, runes_leo), 56 bài đăng, 175 repost. YouTube: 4 giọng nói (WorkOS, Lenny’s Podcast, Y Combinator), bản ghi lời nói. TikTok: 6 giọng nói (ai.native.founder, nikpolale), 34 clip. Instagram: 4 giọng nói (sequenzy_com, ai.builders), 14 reel. Hacker News: 12 giọng nói, 54 câu chuyện, 1k bình luận. GitHub: 6 kho (gastownhall/gastown, NousResearch/hermes), steipete 259+ PR. Các giọng nói hàng đầu: steipete, bcherny, runes_leo, rohit_jsfreaky, MatthewBerman.

Biên soạn từ các lần chạy /last30days ngày 2026-06-07. Các khía cạnh: designing loops that prompt coding agents, ai loops, coding loops.

Đồng sáng lập một công ty lò nướng tự lái (được Weber mua lại) và công ty sau này trở thành Lyft. Đang xây dựng tiếp, sẽ sớm chia sẻ. Tôi chạy các loop gửi PR mã nguồn mở trong khi tôi ngủ, và tôi viết chúng với nghiên cứu /last30days chạy nền.

Hết