Startup AI Nhật Bản ra mô hình AI mới, tuyên bố sánh ngang Claude Fable và Mythos

23/06/2026 20:31

Sakana AI tung ra Fugu - hệ thống điều phối nhiều model AI cùng lúc - đúng 10 ngày sau khi Anthropic bị chính phủ Mỹ buộc tắt hai model mạnh nhất của mình.

Ngày 12/6/2026, Bộ Thương mại Mỹ ra lệnh buộc Anthropic đình chỉ toàn bộ quyền truy cập vào Fable 5 và Mythos 5 - viện dẫn lý do an ninh quốc gia. Anthropic không thể tách riêng người dùng trong nước khỏi người nước ngoài đủ nhanh để tuân thủ lệnh theo đúng nghĩa đen, nên phải tắt cả hai model với toàn bộ khách hàng toàn cầu. Hàng trăm triệu người dùng mất quyền truy cập chỉ trong vài giờ.

Mười ngày sau, Sakana AI - startup AI có trụ sở tại Tokyo - ra mắt Fugu với tuyên bố: bản cao cấp nhất của Fugu đứng "ngang vai" với chính Fable 5 và Mythos, trong khi không vướng bất kỳ lệnh kiểm soát xuất khẩu nào.

Ảnh: Thế Duyệt

Tập trung vào điều phối

Điểm khác biệt của Fugu nằm ở kiến trúc. Thay vì huấn luyện một model khổng lồ đơn lẻ như cách OpenAI, Google hay Anthropic đang làm, Fugu là một model được huấn luyện riêng để đóng vai trò điều phối: nhận câu hỏi từ người dùng, tự quyết định xem nên tự xử lý hay giao cho nhóm các model AI khác, phân công từng phần việc cho từng model phù hợp, kiểm tra kết quả rồi tổng hợp thành một câu trả lời duy nhất. Toàn bộ quá trình này diễn ra sau một API duy nhất - người dùng chỉ thấy một đầu vào và một đầu ra, không cần biết bao nhiêu model đã tham gia vào đó.

Sakana gọi cách tiếp cận này là "trí tuệ tập thể" - lấy cảm hứng từ cách một đàn cá di chuyển nhịp nhàng mà không cần ai chỉ huy từng con. Tên công ty cũng xuất phát từ đó: Sakana nghĩa là "cá" trong tiếng Nhật.

Hệ thống hiện có hai phiên bản. Fugu tiêu chuẩn tối ưu cho tốc độ phản hồi thấp, phù hợp với các tác vụ hàng ngày như viết code, review code, chat. Fugu Ultra phối hợp nhiều model rộng hơn, nhắm vào bài toán phức tạp nhiều bước như nghiên cứu khoa học, phân tích bảo mật, tìm kiếm bằng sáng chế.

Sơ đồ kiến trúc Fugu - một endpoint tiếp nhận request và điều phối nhiều model AI bên trong

Hiệu năng ngang ngửa Claude Fable 5

Sakana công bố loạt kết quả benchmark so sánh Fugu với các model hàng đầu hiện đang có thể truy cập công khai. Trên SWE-Bench Pro - bài kiểm tra kỹ năng lập trình - Fugu Ultra đạt 73,7 điểm, cao hơn Claude Opus 4.8 (69,2) và GPT-5.5 (58,6). Trên LiveCodeBench, Fugu Ultra đạt 93,2 - vượt Gemini 3.1 Pro ở mức 88,5. Trên Humanity's Last Exam, một trong những bài kiểm tra kiến thức tổng hợp khó nhất hiện có, Fugu Ultra đạt 50,0 - sát với Opus 4.8 ở mức 49,8.

Tuy nhiên có một điểm cần lưu ý: Fable 5 và Mythos - hai model Sakana tuyên bố sánh ngang - thực tế không có trong pool của Fugu vì cả hai đều đang bị đình chỉ truy cập. Khi so sánh trực tiếp trên SWE-Bench Pro, Fable 5 vẫn đạt điểm cao hơn Fugu Ultra. Cụm từ Sakana dùng là "ngang vai" (shoulder-to-shoulder), không phải "vượt trội". Ngoài ra, toàn bộ số liệu benchmark là do Sakana tự công bố và chưa được bên thứ ba kiểm chứng độc lập.

Điểm hiệu năng của Fugu do Sakana công bố - Ảnh: Sakana

Cũng đáng chú ý: ở một số bài kiểm tra, Fugu tiêu chuẩn lại đạt điểm cao hơn Fugu Ultra - cho thấy phối hợp thêm nhiều model không phải lúc nào cũng cho kết quả tốt hơn.

Nền tảng học thuật và người đứng sau

Fugu không phải sản phẩm thương mại thuần túy. Kiến trúc của nó dựa trên hai nghiên cứu được chấp nhận tại hội nghị ICLR 2026: TRINITY (hệ thống phân vai Thinker - Worker - Verifier cho từng model trong pool) và Conductor (dùng học tăng cường để tự học chiến lược phối hợp, thay vì kỹ sư viết tay từng quy tắc điều phối).

Đứng sau Sakana AI là David Ha, CEO, cựu nghiên cứu viên tại Google Brain, và Llion Jones, đồng sáng lập kiêm CTO, đồng tác giả của bài báo "Attention Is All You Need" năm 2017 - nền tảng kiến trúc transformer của toàn bộ các model AI hiện đại ngày nay. Công ty thành lập năm 2023 tại Tokyo, hiện được định giá khoảng 2,65 tỷ USD (khoảng 66.000 tỷ đồng) sau vòng gọi vốn Series B tháng 11/2025, với sự tham gia của NVIDIA, Mitsubishi UFJ, Google và nhiều tên tuổi khác.

David Ha và Llion Jones, hai đồng sáng lập của Sakana AI

Giá và khả năng tiếp cận

Fugu có thể truy cập qua API tương thích OpenAI - nghĩa là developer đang dùng Claude, GPT hay Gemini chỉ cần đổi endpoint, không cần viết lại code. Gói trả phí theo token: Fugu Ultra ở mức 5 USD/triệu token đầu vào và 30 USD/triệu token đầu ra (khoảng 125.000 và 750.000 đồng). Gói đăng ký tháng có ba mức: 20, 100 và 200 USD/tháng (khoảng 500.000, 2.500.000 và 5.000.000 đồng), bao gồm cả Fugu và Fugu Ultra. Người dùng đăng ký trước cuối tháng 7/2026 được tặng thêm một tháng miễn phí ở mức đã chọn.

Dịch vụ hiện chưa có tại EU và EEA trong khi Sakana hoàn thiện tuân thủ GDPR. Người dùng tại Việt Nam và phần lớn các quốc gia khác có thể truy cập bình thường qua console.sakana.ai.

Giao diện console Sakana Fugu - Ảnh: Internet

David Ha viết trên X ngay sau khi ra mắt: "Phụ thuộc vào model của một công ty duy nhất cho cơ sở hạ tầng quốc gia là rủi ro lớn. Như lệnh kiểm soát xuất khẩu vừa cho thấy, quyền truy cập có thể biến mất chỉ sau một đêm." Luận điểm này, dù hấp dẫn về mặt thương mại, vẫn có phần mâu thuẫn: pool model của Fugu vẫn phụ thuộc vào Opus, GPT và Gemini - đều là model của Mỹ. Nếu nhiều nhà cung cấp cùng bị hạn chế một lúc, dư địa xoay xở của Fugu cũng thu hẹp lại theo.