DeepSeek: Chatbot AI Trung Quốc khuấy đảo thế giới

Trong bối cảnh công nghệ trí tuệ nhân tạo (AI) đang phát triển như vũ bão, tuần này, cái tên DeepSeek đã bất ngờ vươn lên trở thành tâm điểm chú ý toàn cầu. Ứng dụng chatbot AI của công ty Trung Quốc này không chỉ nhanh chóng chiếm lĩnh vị trí dẫn đầu trên các bảng xếp hạng của Apple App Store và Google Play, mà còn dấy lên những cuộc tranh luận sôi nổi trong giới chuyên gia và nhà đầu tư. Sự xuất hiện của DeepSeek, với các mô hình AI được huấn luyện bằng những kỹ thuật tối ưu hóa điện toán hiệu quả, đã khiến các nhà phân tích Phố Wall và giới công nghệ đặt ra câu hỏi lớn: liệu Mỹ có thể duy trì vị thế dẫn đầu trong cuộc đua AI, và nhu cầu về chip AI có thực sự bền vững như kỳ vọng? DeepSeek không chỉ là một cái tên mới nổi; nó là biểu tượng cho sự trỗi dậy mạnh mẽ của AI Trung Quốc, thách thức những định kiến cũ và mở ra một kỷ nguyên cạnh tranh mới. Vậy, DeepSeek đến từ đâu, và làm thế nào mà nó lại có thể nhanh chóng đạt được danh tiếng quốc tế đến vậy?

Nguồn gốc bất ngờ từ quỹ đầu cơ AI

Ít ai biết rằng, DeepSeek có một xuất phát điểm khá độc đáo, không phải từ một tập đoàn công nghệ khổng lồ mà từ một quỹ đầu cơ định lượng của Trung Quốc mang tên High-Flyer Capital Management. Quỹ này nổi tiếng với việc ứng dụng AI để đưa ra các quyết định giao dịch tài chính. Liang Wenfeng, một người đam mê AI và được biết đến là người từng thử sức với giao dịch tài chính khi còn là sinh viên Đại học Chiết Giang, đã đồng sáng lập High-Flyer vào năm 2015. Đến năm 2019, High-Flyer Capital Management chính thức hoạt động như một quỹ đầu cơ tập trung vào việc phát triển và triển khai các thuật toán AI.

Năm 2023, High-Flyer thành lập DeepSeek như một phòng thí nghiệm chuyên nghiên cứu các công cụ AI, tách biệt khỏi mảng kinh doanh tài chính. Với High-Flyer là một trong những nhà đầu tư, phòng thí nghiệm này sau đó đã tách ra thành một công ty độc lập, cũng mang tên DeepSeek. Ngay từ những ngày đầu, DeepSeek đã tự xây dựng các cụm trung tâm dữ liệu riêng để huấn luyện mô hình. Tuy nhiên, giống như nhiều công ty AI khác ở Trung Quốc, DeepSeek cũng chịu ảnh hưởng từ lệnh cấm xuất khẩu phần cứng của Mỹ. Điều này đã buộc công ty phải sử dụng chip Nvidia H800, một phiên bản kém mạnh hơn so với chip H100 mà các công ty Mỹ có thể tiếp cận, để huấn luyện một trong những mô hình gần đây của mình. Đội ngũ kỹ thuật của DeepSeek được cho là khá trẻ, với việc tuyển dụng tích cực các nhà nghiên cứu AI có bằng tiến sĩ từ các trường đại học hàng đầu Trung Quốc, cùng với những người không có nền tảng khoa học máy tính để giúp AI hiểu rộng hơn về nhiều lĩnh vực.

Mô hình AI mạnh mẽ, đột phá về chi phí

DeepSeek lần đầu tiên giới thiệu bộ mô hình của mình – DeepSeek Coder, DeepSeek LLM và DeepSeek Chat – vào tháng 11 năm 2023. Tuy nhiên, phải đến mùa xuân năm ngoái, khi startup này phát hành dòng mô hình thế hệ tiếp theo DeepSeek-V2, ngành công nghiệp AI mới thực sự chú ý. DeepSeek-V2, một hệ thống phân tích văn bản và hình ảnh đa năng, đã đạt hiệu suất ấn tượng trong nhiều tiêu chuẩn AI khác nhau – và quan trọng hơn, nó có chi phí vận hành thấp hơn đáng kể so với các mô hình tương đương cùng thời điểm. Thành công này đã buộc các đối thủ cạnh tranh trong nước của DeepSeek, bao gồm ByteDance và Alibaba, phải cắt giảm giá sử dụng cho một số mô hình của họ, thậm chí miễn phí hoàn toàn một số khác.

Phiên bản DeepSeek-V3 mới nhất, ra mắt gần đây, càng củng cố danh tiếng của DeepSeek. Theo kết quả thử nghiệm nội bộ của DeepSeek, V3 vượt trội hơn cả các mô hình có thể tải xuống và mã nguồn mở như Llama của Meta, lẫn các mô hình “đóng” chỉ có thể truy cập qua API như GPT-4o của OpenAI. Ấn tượng không kém là mô hình suy luận (reasoning model) DeepSeek R1, ra mắt vào tháng 1. DeepSeek tuyên bố R1 có hiệu suất tương đương với mô hình o1 của OpenAI trên các tiêu chuẩn chính. Với khả năng tự kiểm chứng thông tin, R1 giúp tránh được một số cạm bẫy thường gặp ở các mô hình AI thông thường, mang lại độ tin cậy cao hơn trong các lĩnh vực như vật lý, khoa học và toán học, mặc dù cần nhiều thời gian hơn để đưa ra giải pháp. Tuy nhiên, một nhược điểm của R1, DeepSeek V3 và các mô hình khác của DeepSeek là chúng phải tuân thủ quy định của cơ quan quản lý internet Trung Quốc, đảm bảo các phản hồi “thể hiện các giá trị xã hội chủ nghĩa cốt lõi“, dẫn đến việc chatbot của DeepSeek sẽ không trả lời các câu hỏi về Quảng trường Thiên An Môn hay quyền tự trị của Đài Loan.

Chiến lược “phá vỡ” thị trường và những tranh cãi toàn cầu

Chiến lược kinh doanh của DeepSeek hiện vẫn còn là một ẩn số. Công ty này định giá sản phẩm và dịch vụ của mình thấp hơn nhiều so với giá thị trường, thậm chí miễn phí một số dịch vụ, và không nhận tiền đầu tư dù có rất nhiều quỹ mạo hiểm quan tâm. DeepSeek giải thích rằng những đột phá về hiệu quả đã giúp họ duy trì khả năng cạnh tranh về chi phí cực cao, dù một số chuyên gia vẫn còn hoài nghi về các con số mà công ty đưa ra.

Dù vậy, các nhà phát triển đã đón nhận nhiệt tình các mô hình của DeepSeek. Mặc dù không phải mã nguồn mở theo nghĩa thông thường, chúng vẫn được cấp phép sử dụng linh hoạt cho mục đích thương mại. Theo Clem Delangue, CEO của Hugging Face – một trong những nền tảng lưu trữ mô hình của DeepSeek, các nhà phát triển trên Hugging Face đã tạo ra hơn 500 mô hình “phái sinh” từ R1, với tổng cộng 2,5 triệu lượt tải xuống. Thành công của DeepSeek trước các đối thủ lớn hơn đã được mô tả là “đảo lộn AI” và “được thổi phồng quá mức”. Sự trỗi dậy của DeepSeek ít nhất đã góp phần khiến giá cổ phiếu của Nvidia giảm 18% vào tháng 1 và nhận được phản hồi công khai từ CEO Sam Altman của OpenAI. Trong khi đó, các cơ quan của Bộ Thương mại Hoa Kỳ đã thông báo cấm DeepSeek trên các thiết bị chính phủ do lo ngại về an ninh dữ liệu và tuyên truyền.

Microsoft cũng đã công bố rằng DeepSeek có sẵn trên dịch vụ Azure AI Foundry của họ, nền tảng tập hợp các dịch vụ AI cho doanh nghiệp. Tuy nhiên, Phó chủ tịch Microsoft Brad Smith lại cho biết nhân viên của Microsoft không được phép sử dụng DeepSeek vì những lo ngại tương tự. Các quốc gia và chính phủ khác, bao gồm Hàn Quốc và bang New York, cũng đã cấm DeepSeek trên các thiết bị chính phủ. Về phần mình, OpenAI gọi DeepSeek là “được nhà nước trợ cấp” và “do nhà nước kiểm soát”, khuyến nghị chính phủ Mỹ xem xét cấm các mô hình từ DeepSeek. Ngược lại, CEO Nvidia Jensen Huang lại nhấn mạnh “sự đổi mới xuất sắc” của DeepSeek, cho rằng các mô hình suy luận như vậy rất tốt cho Nvidia vì chúng đòi hỏi sức mạnh tính toán lớn.

DeepSeek đã nhanh chóng khẳng định mình là một thế lực đáng gờm trong lĩnh vực AI toàn cầu, không chỉ nhờ vào các mô hình mạnh mẽ và chi phí cạnh tranh mà còn bởi chiến lược tiếp cận thị trường đầy táo bạo. Sự trỗi dậy này đã gây ra những làn sóng tranh cãi mạnh mẽ, từ những lo ngại về an ninh quốc gia và kiểm soát thông tin đến những thách thức về vị thế dẫn đầu trong cuộc đua AI. Dù tương lai của DeepSeek còn nhiều điều chưa rõ ràng, với những cải tiến mô hình liên tục và sự giám sát ngày càng chặt chẽ từ các chính phủ, không thể phủ nhận rằng DeepSeek đã và đang định hình lại cục diện cạnh tranh AI. Việc theo dõi sát sao DeepSeek sẽ giúp chúng ta hiểu rõ hơn về hướng đi của công nghệ AI, đặc biệt là sự phát triển của AI Trung Quốc, và những tác động đa chiều của nó đến kinh tế, chính trị và xã hội toàn cầu.

DeepSeek: Chatbot AI Trung Quốc khuấy đảo thế giới

Nguồn gốc bất ngờ từ quỹ đầu cơ AI

Mô hình AI mạnh mẽ, đột phá về chi phí

Chiến lược “phá vỡ” thị trường và những tranh cãi toàn cầu

Quick Links

Resources

Support