Trong bối cảnh AI đang bùng nổ mạnh mẽ, các tổ chức đang tìm kiếm những nền tảng đáng tin cậy để xây dựng, triển khai và quản lý các ứng dụng AI tiên tiến. Azure AI Foundry của Microsoft nổi lên như một giải pháp toàn diện, cung cấp một nền tảng thống nhất cho hoạt động AI doanh nghiệp, các nhà xây dựng mô hình và phát triển ứng dụng. Bài viết này sẽ đi sâu vào Azure AI Foundry, cách thức hoạt động, các bước triển khai cơ bản và những thực tiễn tốt nhất để tối ưu hóa việc sử dụng.
- Azure AI Foundry là gì?
Capability | Foundry project | hub based project |
---|---|---|
Agents | ✅ (GA) | ✅ (Preview only) |
Azure AI Foundry Models including Azure OpenAI models | ✅ (Native support) | Available via connections |
AI Foundry API to work with agents and across models | ✅ (Native support) | Available via connections |
Project files (directly upload files and start experimenting) | ✅ | |
Project-level isolation of files and outputs | ✅ | ✅ |
Evaluations | ✅ | ✅ |
Playground | ✅ | ✅ |
Prompt flow | ✅ | |
Managed compute | ✅ | |
Required Azure dependencies | – | Azure Storage account, Azure Key Vault |
Azure AI Foundry là một nền tảng thống nhất, kết hợp cơ sở hạ tầng cấp độ sản xuất với giao diện thân thiện, đảm bảo các tổ chức có thể xây dựng và vận hành ứng dụng AI một cách tự tin. Nền tảng này được thiết kế để các nhà phát triển:
- Xây dựng các ứng dụng AI tạo sinh (generative AI) trên một nền tảng cấp doanh nghiệp.
- Khám phá, xây dựng, kiểm tra và triển khai bằng cách sử dụng các công cụ AI và mô hình học máy (ML) tiên tiến, dựa trên các nguyên tắc AI có trách nhiệm.
- Cộng tác với một nhóm cho toàn bộ vòng đời phát triển ứng dụng.
Azure AI Foundry giúp tăng cường khả năng mở rộng, biến các bằng chứng khái niệm (proof of concepts) thành các ứng dụng sản xuất đầy đủ một cách dễ dàng. Nền tảng này cũng hỗ trợ giám sát và tinh chỉnh liên tục để đảm bảo thành công lâu dài.
Nó cung cấp quyền truy cập vào một thư viện đa dạng các mô hình, dịch vụ và khả năng, cho phép bạn xây dựng các ứng dụng AI phù hợp nhất với mục tiêu của mình. Cụ thể, bạn có thể truy cập hơn 1.700 mô hình nền tảng từ các nhà cung cấp hàng đầu như Microsoft, OpenAI, Hugging Face, Meta và Cohere.
Microsoft coi Azure AI Foundry như một “nhà máy tác nhân” (agent factory) – một hệ thống sản xuất mô-đun được thiết kế để chuẩn hóa việc xây dựng các hệ thống thông minh thông qua các thành phần được xây dựng sẵn, quy trình chuẩn hóa và cải tiến liên tục dựa trên phản hồi vận hành.
Về chi phí, nền tảng này miễn phí để khám phá và sử dụng, chi phí sẽ phát sinh ở cấp độ triển khai (deployment level) và các dịch vụ Azure cơ bản khác mà bạn sử dụng.
- Azure AI Foundry hoạt động như thế nào?
Hoạt động phát triển chủ yếu diễn ra trong một dự án Azure AI Foundry. Có hai loại dự án chính:
- Dự án Foundry (Foundry project): Được xây dựng trên tài nguyên Azure AI Foundry. Loại dự án này cung cấp thiết lập đơn giản, quyền truy cập vào các tác nhân (agents) đã GA và các mô hình hàng đầu trong ngành từ OpenAI, Mistral, Meta, v.v., với hỗ trợ nguyên bản cho các mô hình và API AI Foundry. Đây là lựa chọn được khuyến nghị trong hầu hết các trường hợp để xây dựng tác nhân hoặc làm việc với các mô hình.
- Dự án dựa trên trung tâm (hub based project): Được lưu trữ bởi một trung tâm Azure AI Foundry. Thường được sử dụng khi bạn cần các tính năng không có sẵn trong dự án Foundry. Các tác nhân chỉ ở chế độ xem trước (Preview) và quyền truy cập mô hình/API thông qua kết nối, yêu cầu tài khoản Azure Storage và Azure Key Vault.
Bạn có thể xác định loại dự án của mình thông qua điều hướng “breadcrumb” (sẽ hiển thị “(AI Foundry)” hoặc “(Hub)”) hoặc trang “All resources” (sẽ hiển thị “(AI Foundry)” hoặc “(Hub)” là tài nguyên gốc).
Chu trình phát triển trong Azure AI Foundry thường trải qua ba giai đoạn chính, được sắp xếp theo mục tiêu của bạn trên bảng điều khiển bên trái:
- Xác định và khám phá (Define and explore): Giai đoạn này tập trung vào việc xác định mục tiêu dự án, sau đó khám phá và kiểm tra các mô hình và dịch vụ phù hợp với trường hợp sử dụng của bạn.
- Xây dựng và tùy chỉnh (Build and customize): Bạn tích cực xây dựng các giải pháp và ứng dụng bằng các mô hình, công cụ và khả năng đã chọn. Bạn cũng có thể tùy chỉnh các mô hình để hoạt động tốt hơn cho trường hợp sử dụng của mình thông qua tinh chỉnh (fine-tuning) hoặc làm cho mô hình dựa trên dữ liệu riêng (grounding in your data).
- Quan sát và cải thiện (Observe and improve): Trong giai đoạn này, bạn tìm kiếm cách cải thiện hiệu suất ứng dụng của mình. Bạn có thể sử dụng các công cụ như theo dõi (tracing) để gỡ lỗi ứng dụng hoặc so sánh các đánh giá (evaluations) để tinh chỉnh hành vi của ứng dụng. Bạn cũng có thể tích hợp với các hệ thống an toàn & bảo mật.
Để quản lý tài nguyên, quyền truy cập và hạn mức của nhóm, người quản lý có thể sử dụng Trung tâm quản lý (Management Center). Trung tâm này hợp lý hóa các hoạt động quản trị và quản lý.
Azure AI Foundry tích hợp sâu với Azure OpenAI Service, cung cấp quyền truy cập API REST vào các mô hình ngôn ngữ mạnh mẽ của OpenAI, bao gồm các dòng o4-mini, o3, gpt-4.1, GPT-4o, GPT-4 series, GPT-3.5-Turbo và Embeddings. Các mô hình này có thể được điều chỉnh cho nhiều nhiệm vụ như tạo nội dung, tóm tắt, hiểu hình ảnh, tìm kiếm ngữ nghĩa và dịch ngôn ngữ tự nhiên sang mã.
3. Các bước triển khai Azure AI Foundry cơ bản
Mặc dù không có danh sách từng bước được đánh số chính xác, nhưng dựa trên các nguồn, chúng ta có thể phác thảo các bước triển khai chung như sau:
- Bắt đầu và thiết lập tài khoản:
- Bạn có thể khám phá cổng thông tin Azure AI Foundry (bao gồm danh mục mô hình) mà không cần đăng nhập.
- Để có đầy đủ chức năng, bạn cần có tài khoản Azure.
- Tạo một dự án Azure AI Foundry để bắt đầu công việc phát triển của bạn. Bạn sẽ chọn giữa dự án Foundry (được khuyến nghị cho các tác nhân và mô hình) hoặc dự án dựa trên trung tâm (nếu công ty bạn đã tạo một trung tâm).
- Nếu sử dụng Azure OpenAI, bạn cần tạo tài nguyên Azure OpenAI trong gói đăng ký Azure của mình.
- Sau khi tạo tài nguyên, bạn phải triển khai một mô hình (ví dụ: GPT-4o) trước khi có thể gọi API.
- Bạn có thể thử nghiệm khả năng của mô hình trong các sân chơi (playgrounds) của cổng thông tin Azure AI Foundry hoặc bắt đầu gọi API trực tiếp.
- Phát triển ứng dụng AI:
- Xác định mục tiêu và khám phá mô hình: Đặt ra các mục tiêu rõ ràng cho ứng dụng AI của bạn và khám phá danh mục mô hình để tìm ra những mô hình phù hợp nhất.
- Xây dựng và tùy chỉnh giải pháp: Tích cực phát triển ứng dụng bằng cách sử dụng các mô hình và công cụ đã chọn. Bạn có thể tinh chỉnh (fine-tune) các mô hình để chúng hoạt động tối ưu hơn với dữ liệu và trường hợp sử dụng cụ thể của bạn. Prompt flow là một công cụ giúp thiết kế, xây dựng, đánh giá và triển khai các quy trình làm việc của mô hình ngôn ngữ.
- Sử dụng SDK và môi trường phát triển ưa thích: Bạn có thể làm việc với dự án của mình trong cổng thông tin Azure AI Foundry hoặc sử dụng SDK trong môi trường phát triển ưa thích của bạn. Microsoft cung cấp một tiện ích mở rộng Azure AI Foundry mới cho Visual Studio Code, cho phép nhà phát triển xây dựng, kiểm tra và triển khai các ứng dụng dựa trên tác nhân hoàn toàn trong IDE của họ.
- Quan sát và cải thiện liên tục:
- Theo dõi hiệu suất: Sử dụng các công cụ như theo dõi (tracing) để gỡ lỗi ứng dụng của bạn và so sánh các đánh giá (evaluations) để điều chỉnh cách ứng dụng hoạt động.
- Đảm bảo an toàn và bảo mật: Tích hợp các hệ thống an toàn và bảo mật để tự tin đưa ứng dụng vào sản xuất. Azure AI Foundry bao gồm một hệ thống phản hồi và bộ công cụ quan sát nâng cao (đánh giá, theo dõi và A/B testing) để liên tục cải thiện hệ thống AI của bạn.
4. Chia sẻ các thực tiễn tốt nhất khi làm việc với Azure AI Foundry
Để tối ưu hóa việc triển khai Azure AI Foundry và các dịch vụ AI liên quan, hãy tham khảo các thực tiễn tốt nhất sau:
- Xem xét kiến trúc (Architectural considerations):
- Thiết kế cho khả năng mở rộng: Sử dụng các dịch vụ có thể mở rộng của Azure để xử lý các khối lượng công việc khác nhau, đảm bảo hiệu suất ổn định trong thời gian cao điểm. Triển khai tự động mở rộng (auto-scaling).
- Tối ưu hóa chi phí: Giám sát và quản lý tài nguyên để tránh chi phí không cần thiết. Chọn các cấp giá phù hợp dựa trên nhu cầu khối lượng công việc.
- Thực tiễn bảo mật tốt nhất (Security best practices):
- Mã hóa dữ liệu: Thực hiện mã hóa dữ liệu khi lưu trữ và truyền tải để bảo vệ chống truy cập trái phép.
- Kiểm soát truy cập: Sử dụng Kiểm soát truy cập dựa trên vai trò (RBAC) của Azure để hạn chế quyền truy cập vào tài nguyên AI, đảm bảo chỉ nhân viên được ủy quyền mới có thể tương tác với dữ liệu nhạy cảm.
- Chiến lược quản trị (Governance strategies):
- Gắn thẻ tài nguyên: Thực hiện gắn thẻ nhất quán cho các tài nguyên AI để dễ dàng theo dõi, quản lý và phân bổ chi phí.
- Thực thi chính sách: Sử dụng Azure Policy để thực thi các tiêu chuẩn của tổ chức và đánh giá tuân thủ trên các tài nguyên AI.
- Quản lý tập trung: Tận dụng trải nghiệm trung tâm quản lý mới trong cổng thông tin Azure AI Foundry để có khả năng quan sát và kiểm soát tốt hơn các tài nguyên AI của bạn, bao gồm tài nguyên được kết nối, đặc quyền truy cập và việc sử dụng hạn mức.
- Xem xét mạng (Networking considerations):
- Mạng ảo (VNet) và Điểm cuối riêng tư (Private Endpoints): Cách ly tài nguyên AI trong VNet để tăng cường bảo mật và kiểm soát luồng lưu lượng truy cập. Sử dụng các điểm cuối riêng tư để kết nối an toàn với các dịch vụ AI, giảm thiểu việc tiếp xúc với internet công cộng.
- Mô hình kết nối VNet: Chọn giữa VPN Gateway-to-Gateway (cho khối lượng công việc được quy định, kết nối đa vùng, mã hóa IPsec) và VNet Peering (độ trễ thấp nhất trong cùng vùng/tenant khi không cần mã hóa đường hầm).
- Quản lý và tối ưu hóa hạn mức (Quota management and optimization):
- Giám sát việc sử dụng: Thường xuyên giám sát việc sử dụng mã thông báo (token) và tỷ lệ yêu cầu để đảm bảo nằm trong hạn mức được phân bổ.
- Yêu cầu tăng hạn mức chủ động: Nếu gần đạt giới hạn hạn mức, hãy yêu cầu tăng trước để tránh gián đoạn dịch vụ.
- Đơn vị thông lượng được cấp phép (Provisioned Throughput Units – PTUs):
- Đánh giá nhu cầu khối lượng công việc: Xác định xem PTU có phù hợp với yêu cầu hiệu suất và chi phí của khối lượng công việc của bạn không.
- Lập kế hoạch mở rộng: Phân bổ PTU dựa trên mức tăng trưởng dự kiến, đảm bảo hệ thống AI có thể xử lý nhu cầu tăng lên.
- Giám sát và ghi nhật ký (Monitoring and logging):
- Bật nhật ký chẩn đoán: Thu thập nhật ký chi tiết để khắc phục sự cố và phân tích hiệu suất.
- Thiết lập cảnh báo: Cấu hình cảnh báo cho các bất thường hoặc giảm hiệu suất để cho phép phản ứng chủ động.
- Sử dụng Azure Monitor: Để thu thập, phân tích và hành động trên dữ liệu đo từ xa từ các tài nguyên Azure OpenAI của bạn.
- Chiến lược triển khai Gateway đa vùng cho Azure OpenAI (Multi-region gateway deployment strategy):
- Được khuyến nghị để tăng cường độ tin cậy, độ trễ và khả năng phục hồi cho người dùng Azure OpenAI phân bố địa lý.
- Sử dụng Azure API Management Premium – Triển khai đa vùng (được khuyến nghị cho quy mô doanh nghiệp) hoặc phiên bản APIM Standard với bộ cân bằng tải bên ngoài (thay thế tiết kiệm chi phí).
- Áp dụng các chiến lược bổ sung như mô hình gateway đa backend, sử dụng Microsoft Public Backbone và tích hợp các quy tắc chuyển đổi dự phòng (failover rules) cho kinh doanh liên tục & phục hồi sau thảm họa (BCDR).
- AI có trách nhiệm (Responsible AI):
- Microsoft cam kết phát triển AI dựa trên các nguyên tắc đặt con người lên hàng đầu.
- Sử dụng AI Red Teaming Agent (hiện đang ở chế độ xem trước công khai) để thăm dò có hệ thống các mô hình AI nhằm phát hiện rủi ro an toàn.
- Tận dụng các đánh giá tác nhân (agentic evaluations) mới để cung cấp các đánh giá rủi ro và chất lượng toàn diện, giúp xây dựng các tác nhân AI đáng tin cậy và tuân thủ.
- Cải tiến liên tục:
- Hệ thống phản hồi cốt lõi của Azure AI Foundry được thiết kế để tạo ra chu trình cải tiến liên tục thông qua đo từ xa thời gian thực và phản hồi của người dùng. Điều này được bổ sung bởi bộ công cụ quan sát nâng cao—đánh giá, theo dõi và A/B testing—mang lại khả năng hiển thị chưa từng có về hành vi và kết quả của tác nhân.
Kết luận:
Azure AI Foundry của Microsoft đang dẫn đầu trong việc dân chủ hóa AI, biến công nghệ AI tiên tiến trở nên dễ tiếp cận và quản lý hơn đối với các doanh nghiệp thuộc mọi quy mô. Bằng cách tuân thủ các thực tiễn tốt nhất này, các tổ chức có thể quản lý và bảo mật hiệu quả các khối lượng công việc Azure AI của mình, đảm bảo chúng đáng tin cậy, hiệu quả và tuân thủ các tiêu chuẩn ngành.
Để bắt đầu hành trình AI của bạn với Azure AI Foundry, hãy khám phá cổng thông tin và các tài nguyên liên quan được cung cấp bởi Microsoft.