Phần mềm đang chuyển dịch từ những ứng dụng thiết kế cho con người sang các agent có thể suy luận, truy xuất ngữ cảnh, và hành động thay mặt người dùng. Sự dịch chuyển đó đòi hỏi một lớp API hoàn toàn khác. Ngày 2/6/2026, Microsoft công bố Work IQ APIs sẽ generally available (GA) từ 16/6/2026 – bộ API được thiết kế để trở thành cách tốt nhất giúp agent tương tác với dữ liệu và ứng dụng Microsoft 365.
Work IQ là gì?
Work IQ là lớp trí tuệ (intelligence layer) đứng sau cách công việc thực sự vận hành. Nó liên tục xử lý nội dung từ email, lịch, cuộc họp, chat, tệp tin, con người, các mẫu hình cộng tác (collaboration patterns), và cả hệ thống line-of-business của tổ chức bạn, để xây dựng một sự hiểu biết ngữ nghĩa (semantic understanding) toàn diện về doanh nghiệp.
Điều Work IQ mang lại không chỉ là dữ liệu thô, mà là trí tuệ bạn không thể có được nếu chỉ nhìn vào dữ liệu đơn thuần: một mô hình theo thời gian thực về cách tổ chức của bạn đang vận hành. Với Work IQ APIs, developer có thể đưa trực tiếp sự hiểu biết đó vào chính agent của mình – để agent làm việc với ngữ cảnh kinh doanh, chứ không chỉ dữ liệu thô, và có thể hành động xuyên suốt tổ chức.

5 ưu thế cốt lõi của Work IQ APIs
Giao diện truyền thống được thiết kế cho tương tác của con người, nhưng agent vận hành khác hẳn. Chúng cần ngữ cảnh phong phú hơn, bề mặt công cụ (tool surface) đơn giản hơn, độ trễ thấp hơn, và các cơ chế kiểm soát doanh nghiệp được tích hợp sẵn ngay từ đầu. Đây chính xác là điều Work IQ APIs được xây dựng để đáp ứng, với 5 ưu thế cốt lõi:
1. Thông minh (Intelligence)
Work IQ APIs mang lại kết quả chất lượng cao hơn cho agent vì chúng làm nhiều hơn việc truy xuất hay tìm kiếm nội dung đơn thuần. Work IQ được xây trên một chỉ mục ngữ nghĩa (semantic index) với độ trễ cực thấp, bộ nhớ cá nhân (personal memory), kỹ năng cá nhân và tổ chức, cấu trúc schema trên nền tệp tin, cùng khả năng tinh chỉnh theo tri thức đặc thù doanh nghiệp. Kết quả là agent có thể làm việc với ngữ cảnh cập nhật liên tục và phù hợp nhất, cùng sự hiểu biết toàn diện về con người, cơ cấu tổ chức, vai trò và mẫu hình cộng tác.
2. Tốc độ (Speed)
Work IQ APIs vận hành ở tốc độ của agent. Chúng sử dụng hệ thống truy xuất được tối ưu riêng cho agent, giúp giảm số vòng lặp gọi tới dịch vụ (round trips) và giảm độ trễ khi truy cập ngữ cảnh phong phú. Với việc gọi công cụ (tool calling), Work IQ APIs gom gọn thao tác chỉ còn 10 công cụ tổng quát (generic tools) với cơ chế bộc lộ tiệm tiến (progressive disclosure) qua Model Context Protocol (MCP) – nên developer không cần dạy agent hàng trăm công cụ riêng cho từng loại dữ liệu. Bề mặt đơn giản hơn giúp agent chuyển từ suy luận sang hành động nhanh hơn nhiều, đồng thời tăng thông lượng (throughput), tăng tốc số token phản hồi mỗi giây.
3. Hiệu quả (Efficiency)
Work IQ APIs giảm tổng số token cần thiết để truy xuất ngữ cảnh và sử dụng công cụ, bằng cách chuyển phần lớn xử lý AI vào chính runtime của Work IQ. Thay vì trả về dữ liệu thô mà tầng điều phối (orchestration layer) phải tự đọc, ghép nối và diễn giải, các mô hình ngôn ngữ lớn (LLM) chuyên biệt và agent bên trong Work IQ sẽ đóng gói sẵn ngữ cảnh và dữ liệu theo cấu trúc dễ tiêu thụ hơn cho agent. Hệ thống cũng cắt gọn các chuỗi bản ghi tệp, message ID, app ID trong lúc gọi công cụ để tiết kiệm token.
4. Quy mô (Scale)
Work IQ được tối ưu để đáp ứng quy mô sử dụng của agent. Khi con người dùng phần mềm, mô hình sử dụng thường ngắt quãng và tương đối nông. Ngược lại, agent thực thi các thao tác liên tục, tần suất cao, nhiều bước – rộng, sâu và có hệ thống hơn nhiều so với cách con người dùng phần mềm. Work IQ được thiết kế cho đúng mẫu hình sử dụng này cùng thông lượng cao hơn đi kèm, cho phép Microsoft 365 mở rộng quy mô khi hàng trăm triệu agent xuất hiện trong vài năm tới.
5. Bảo mật (Security)
Với Work IQ, hoạt động của agent được bảo mật ngay từ thiết kế (secure by design). Dữ liệu, ngữ cảnh và insight luôn nằm trong ranh giới tin cậy (trust boundary) của tenant Microsoft 365, và mọi hành động agent thực hiện đều có thể kiểm toán (auditable) và khám phá được (discoverable). Điều này mang lại cho developer và bộ phận IT các cơ chế kiểm soát cần thiết để xây dựng agent doanh nghiệp mà không phải bổ sung một tầng quản trị riêng biệt.
Kiến trúc Work IQ APIs: 4 domain

Work IQ APIs gồm 4 domain, ánh xạ đúng theo cách agent làm việc:
- Chat – Truy cập theo chương trình (programmatic) tới toàn bộ sức mạnh và trí tuệ của Microsoft 365 Copilot. Chat API trả về phản hồi (kèm trích dẫn) giống hệt như Copilot sẽ trả lời người dùng, đồng thời cho phép truy cập theo chương trình tới các agent trong Copilot.
- Context – Truy cập theo chương trình tới ngữ cảnh và dữ liệu nguồn sẵn sàng cho agent. Context API tổng hợp nội dung mà Copilot sẽ dùng để trả lời một truy vấn, nhưng thay vì tổng hợp thành câu trả lời, nó trả về ngữ cảnh ở định dạng được thiết kế riêng cho agent tiêu thụ.
- Tools – Truy cập dạng agentic tới các thực thể (entities) và hành động của Microsoft 365 thông qua một bộ động từ (verbs) đơn giản, kèm đường dẫn tài nguyên (resource paths) bổ trợ để xác định phạm vi công việc. Ví dụ: gửi email, lên lịch họp, tải tài liệu, và nhiều hơn nữa – giúp agent có cách làm việc ổn định, thích ứng với dữ liệu mới và kịch bản thay đổi mà không phải mở rộng bề mặt API mỗi lần.
- Workspaces – Khi agent làm việc, chúng cần một nơi an toàn để lưu trạng thái và dữ liệu trung gian trong quá trình thực thi. Digital workspace của Work IQ nằm trong ranh giới tenant Microsoft 365, lưu trữ dữ liệu, tệp tin, bộ nhớ, tiến độ và kết quả trung gian khi agent suy luận qua từng bước công việc. Đây chính là yếu tố then chốt khi Microsoft xây dựng Copilot Cowork, Microsoft Scout và các agent chạy dài hạn (long running agents) khác.
Developer đã có thể bắt đầu xây dựng với các domain này ngay từ bây giờ, thông qua bản public preview trên GitHub, trước khi GA chính thức vào ngày 16/6.
Work IQ APIs tính phí như thế nào?
Work IQ APIs áp dụng mô hình tính phí theo mức tiêu thụ (consumption-based pricing), gồm một phần cố định cho Tools và một phần biến động cho Chat và Context. Giá được tính bằng Copilot Credits.
Song song đó, Microsoft cũng ra mắt một dashboard quản lý chi phí mới trong trung tâm quản trị Microsoft 365. Quản trị viên IT sẽ có thể xem lại mức sử dụng AI credit, cấu hình hình thức thanh toán Copilot Credit (trả trước hoặc trả theo mức sử dụng), thiết lập hạn mức chi tiêu cho từng tenant, nhóm và người dùng trên các agent/dịch vụ, đồng thời theo dõi các yêu cầu credit từ người dùng. Work IQ APIs sẽ là sản phẩm đầu tiên được quản lý qua trải nghiệm này, và theo thời gian Microsoft sẽ đưa thêm các sản phẩm khác dùng Copilot Credits vào, bao gồm Microsoft Copilot Studio.
Vì sao developer và IT admin nên quan tâm?
Work IQ là lớp trí tuệ mới cho Microsoft 365, được thiết kế để hiểu cách công việc thực sự diễn ra trong tổ chức của bạn. Work IQ APIs mang lại cho developer và quản trị viên IT một cách thực tế để xây dựng agent doanh nghiệp với đầy đủ ngữ cảnh, công cụ, khả năng mở rộng quy mô và cơ chế kiểm soát mà những agent đó cần để vận hành bên trong Microsoft 365. Với ngày GA 16/6, các tổ chức đã có thể bắt đầu xây dựng trên cùng lớp trí tuệ đang vận hành Copilot.
Nếu tổ chức bạn đang phát triển agent nội bộ hoặc tích hợp với Microsoft 365 Copilot, đây là thời điểm phù hợp để đánh giá Work IQ APIs cho lộ trình phát triển sắp tới. Theo dõi thêm các bài phân tích chuyên sâu về Copilot, Work IQ và hệ sinh thái agent của Microsoft tại Master Learning Hub.
Lưu ý: các mốc thời gian, tính năng và giá nêu trong bài là thông tin tại thời điểm công bố và có thể thay đổi, theo đúng công bố gốc của Microsoft.






















































































































































































