CuongDC 📸

Forwarded from Animal race (Thế Giới Quanh em)

"Trùm cuối" tại TP.HCM, bé Na khiến nhiều người thốt lên: "Hoa hậu" đây rồi!

Đội cái nón lá rồi quấn khăn rằn Nam Bộ nhìn hợp lý

Ảnh: Viết Thanh

👍1

515 views00:20

CuongDC 📸

Forwarded from Animal race (Thế Giới Quanh em)

Bé Na Lạng Sơn

513 views00:20

CuongDC 📸

Forwarded from Animal race (Thế Giới Quanh em)

Bé Na Lạng Sơn

ặp linh vật này có màu vàng chủ đạo, được làm từ chất liệu xốp, với chiều cao lần lượt là 3 m và 2,8 m (chưa tính kệ đỡ). Cả hai đều đội khăn xếp lấy cảm hứng từ trang phục truyền thống Việt Nam, tạo nên hình ảnh mềm mại, dễ nhìn, phù hợp với thị hiếu của nhiều lứa tuổi.

Nhà thiết kế mỹ thuật Kim Chi, người thực hiện cặp linh vật này, cho biết quá trình từ lên ý tưởng đến hoàn thiện thi công mất khoảng 3 tháng. Chị cũng là người đã thực hiện các linh vật cho thành phố Lạng Sơn trong nhiều năm qua. Việc thiết kế linh vật theo hướng đáng yêu nhằm giảm bớt sự sợ hãi đối với những con vật ngoài đời thường được coi là đáng sợ như rắn, đồng thời tạo điểm nhấn thu hút người dân và du khách đến tham quan, chụp hình trong dịp Tết.

527 views00:20

CuongDC 📸

DEEPSEEK HẠN CHẾ GÌ? DeepSeek đang làm rúng động nước Mỹ và thế giới. Sau khi thị trường chứng khoán Mỹ mở cửa chưa đầy 2h, cổ phiếu của NVDA (công ty sản xuất phần cứng AI nổi tiếng nhất thế giới) sụt 15%, tương đương với gần 500 tỷ USD (bằng GDP của Việt…

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

DEEPSEEK ĐẠP BIG TECH MỸ BAY 1000 tỷ $

• Vị trí trên App Store: DeepSeek AI Assistant đã vượt qua ChatGPT để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của Apple tại Mỹ.

• Khả năng tư duy suy luận: Mô hình DeepSeek R1 được đánh giá có khả năng giải quyết các vấn đề phức tạp, tương đương hoặc vượt trội so với các mô hình của OpenAI.

• Chi phí phát triển: DeepSeek đã phát triển mô hình của mình với chi phí thấp hơn đáng kể so với các đối thủ, sử dụng khoảng 2.000 chip Nvidia H800, ít hơn nhiều so với 16.000 chip mà OpenAI sử dụng cho GPT-4.

• Mã nguồn mở: DeepSeek đã công bố mã nguồn của mô hình R1, cho phép cộng đồng truy cập và sử dụng.

• Tác động đến thị trường: Sự ra mắt của DeepSeek đã gây ra biến động lớn trên thị trường chứng khoán, với việc giảm giá trị của nhiều cổ phiếu công nghệ lớn.

Tuy nhiên, cần lưu ý rằng DeepSeek có thể áp dụng các cơ chế kiểm duyệt nội dung, đặc biệt đối với các chủ đề nhạy cảm về chính trị.

❤1👍1

600 viewsedited 00:32

CuongDC 📸

Forwarded from CuongDC 📸

3:18

Media is too big

VIEW IN TELEGRAM

CHÍNH THỨC: DỪNG TRÌNH DIỄN DRONE MỸ ĐÌNH

UBND quận Nam Từ Liêm (Hà Nội) đã quyết định hủy bỏ phần trình diễn ánh sáng bằng thiết bị bay không người lái (drone) trong chương trình nghệ thuật “Rực rỡ Thăng Long 2025” dự kiến diễn ra vào đêm giao thừa 28-1-2025.

Quyết định này được đưa ra sau sự cố trong buổi tổng duyệt tối 26-1, khi một số drone gặp trục trặc kỹ thuật, rơi xuống bãi đất trống và gây cháy đám cỏ khô trong khuôn viên trường đua F1.

Mặc dù sự cố đã được kiểm soát kịp thời và không gây thiệt hại về người hay tài sản, ban tổ chức vẫn quyết định dừng phần trình diễn drone để đảm bảo an toàn và thành công cho chương trình.

Chương trình nghệ thuật “Rực rỡ Thăng Long 2025” vẫn sẽ diễn ra vào tối 28-1 tại quảng trường Mỹ Đình, với sự tham gia của nhiều nghệ sĩ nổi tiếng và màn bắn pháo hoa tầm cao vào khoảnh khắc giao thừa.

NHIỀU DRONE RƠI MỞ MỸ ĐÌNH TẠO CẢNH TƯỢNG HY HỮU

Tối 26/1/2025, trong buổi tổng duyệt chương trình nghệ thuật “Rực rỡ Thăng Long 2025” tại sân vận động Mỹ Đình, Hà Nội, đã xảy ra sự cố khi một số thiết bị bay không người lái (drone) gặp trục trặc kỹ thuật, rơi xuống bãi đất trống và gây cháy đám cỏ khô. Ban tổ chức cho biết đây là tình huống đã được dự liệu trong phương án đảm bảo an toàn, nên các lực lượng chức năng đã kịp thời dập tắt đám cháy, không gây thiệt hại về người và tài sản.

84 views04:25

CuongDC 📸

DEEPSEEK ĐẠP BIG TECH MỸ BAY 1000 tỷ $ • Vị trí trên App Store: DeepSeek AI Assistant đã vượt qua ChatGPT để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của Apple tại Mỹ. • Khả năng tư duy suy luận: Mô hình DeepSeek R1 được đánh…

DEEPSEEK : NHANH -NHIỀU -TỐT -RẺ

Bài này mình giải thích thêm vì sao DeepSeek lại gây rúng động nước Mỹ và thế giới, khiến hơn 1000 tỉ USD bốc hơi từ thị trường chứng khoán trong 1 ngày, trong đó gồm 600 tỉ USD của NVDA - công ty sản xuất phần cứng cho AI và 100 tỉ USD của Oracle - công ty đang định liên doanh cùng OpenAI trong dự án Stargate 500 tỉ USD. Các công ti công nghệ lớn khác như Microsoft (đang liên doanh với OpenAI và sử dụng mô hình AI của OpenAI) và Google (đang xây dựng dòng mô hình AI khác là Gemini) cũng giảm cỡ 100 tỉ USD.

Mô hình AI mới nhất của DeepSeek là DeepSeek-R1 có khả năng nhỉnh hơn một chút so với o1 của OpenAI và vượt trội so với Gemini của Google. Ví dụ, kết quả trên bài thi HLE (bài thi khó nhất cho AI hiện nay) thì kết quả của 3 mô hình là lần lượt là 9.4%, 9.1% và 6.2%.

Tuy nhiên điều thực sự nổi bật của DeepSeek là mặc dù chất lượng cao như vậy, giá cả lại rất rẻ. Nếu bạn dùng trên web và phone, bạn được dùng free với tính năng tương tự bản trả phí 20$/tháng của OpenAI. Nếu bạn dùng thông qua gọi hàm API (để sử dụng trực tiếp trong ứng dụng AI của chính bạn) thì chi phí chỉ khoảng 5% so với OpenAI.

Đặc biệt DeepSeek đem "cho không" (open-weight) các mô hình AI của mình, bao gồm từ mô hình lớn nhất DeepSeek-R1 671 tỉ tham số đến các mô hình chiết xuất nhỏ hơn chỉ khoảng 1 tỉ tham số. Có nghĩa là bạn có thể download bộ tham số của các mô hình này đem về nhà chạy trên chính máy của bạn; hoặc huấn luyện thêm cho các tác vụ đặc biệt.

Điều này có nghĩa là gì? Thứ nhất, các công ty lớn về công nghệ AI như OpenAI, Google, Microsoft không còn lợi thế cạnh tranh về giá cả hay chất lượng nữa. Như một người bạn của mình bình luận "nếu DeepSeek có thể làm việc được như ChatGPT mà ra kết quả nhanh hơn, ít tốn điện hơn thì em sẽ dùng DeepSeek." Thực tế là như thế. Chỉ trong một vài ngày, DeepSeek đã vượt qua ChatGPT để trở thành phần mềm xếp hạng số 1 trên Apple App Store. Rất nhiều người dùng đang dùng bản trả phí của ChatGPT hay Gemini sẽ dừng để chuyển sang dùng DeepSeek. Các nhà phát triển công cụ AI có thể đổi sang dùng API của DeepSeek với giá thấp hơn 20 lần.

Các công ty lớn về công nghệ phần cứng AI như NVDA, AMD, Broadcom... cũng không còn bán được các sản phẩm cao cấp với giá cao nữa. Các mô hình của DeepSeek được tối ưu về cài đặt nên có thể chạy trên các hệ phần cứng cấp thấp với chi phí nhỏ hơn rất nhiều. Ví dụ, trước đây Meta huấn luyện mô hình Llama của họ cần 16 ngàn GPU H100 của NVDA (giá 40K USD một chiếc), tốn khoảng 100 triệu USD thì DeepSeek huấn luyện mô hình của họ chỉ trên 2048 GPU H800 của NVDA (giá chỉ 20K USD một chiếc). Nhiều người còn chạy được các mô hình DeepSeek biến thể nhỏ hơn ngay trên chính laptop của họ.

Nhiều công ty (nhất là các công ty ở Trung Quốc đang bị cấm vận mua phần cứng mạnh của Mỹ) có thể mua phần cứng giá rẻ và tải DeepSeek về chạy trong nội bộ, giải quyết vấn đề bảo mật và riêng tư (security và privacy). Khi mình tham gia làm phần mềm ứng dụng AI cho các khách hàng doanh nghiệp thì một trong các mối quan tâm lớn nhất của họ là vấn đề này. Rất nhiều khách hàng yêu cầu thông tin và dữ liệu của họ phải xử lý hoàn toàn trong hệ thống nội bộ của họ hoặc của bên mình (on-premise). Nên khi nghe thông tin sẽ được gửi qua bên thứ ba (như Microsoft hay OpenAI) thì hầu hết khách hàng ngần ngại không dám triển khai áp dụng AI. Nhưng bây giờ mô hình AI của DeepSeek (cho không miễn phí và có thể sử dụng trên phần cứng giá rẻ) sẽ giải quyết được vấn đề này triệt để. Do đó mình tin sắp tới ứng dụng AI cho doanh nghiệp sẽ bùng nổ hơn nữa.

"Nhiều nhanh tốt rẻ" để bán phá giá là đặc trưng của Trung Quốc.

Điều này gây thiệt hại rất lớn cho các công ty công nghệ của Mỹ nhưng có lợi cho người dùng toàn thế giới, nhất là các nước còn nghèo như Việt Nam.

-NGUYEN THANH TUNG

❤3

552 views06:01

CuongDC 📸

✔️TRUNG QUỐC KO HỀ NGHÈO ĐỂ CHẠY DEEPSEEK, VẬY SỰ THỰC CÂU CHUYỆN NÀY LÀ GÌ?
✔️TẠI SAO MỸ LO SỐT VÓ TRƯỚC DEEPSEEK?
✔️CƠ HỘI NÀO CHO NƯỚC NGHÈO NHƯ VIỆT NAM?

Douma, hôm nay hơn 1.000 tỉ đô đã “bay” khỏi thị trường chứng khoán Mỹ do DeepSeek “đạp” giá cổ phiếu Big Tech xuống vực. :))))

Nguyên nhân: Các nhà đầu tư đang đặt câu hỏi lớn: “Liệu Big Tech Mỹ, với số tiền hơn 200 tỉ đô đã đổ vào hạ tầng AI (chủ yếu là mua GPU của Nvidia) trong năm qua, có thực sự xứng đáng? Hay họ đang đốt tiền một cách ngu ngốc? Hoặc tệ hơn, họ đang lừa các cổ đông?”

DeepSeek, startup AI từ Trung Quốc, tuyên bố rằng họ đã phát triển mô hình AI tương đương OpenAI chỉ với… 5 triệu đô! Đây là con số chỉ bằng 1/100 so với khoản đầu tư của OpenAI và Microsoft để huấn luyện các mô hình tương tự. 🙃

Điều thú vị nhất là cổ phiếu giảm sâu nhất lại chính là… NVIDIA (NVDA). :))))) Lý do? DeepSeek tuyên bố họ chỉ cần 1/100 số GPU để huấn luyện mô hình AI và thậm chí là sử dụng loại GPU “cùi” như H800, thay vì các dòng cao cấp nhất như H100 của Nvidia. :)))) Điều này khiến các khoản đầu tư dự kiến mua 1,5 triệu GPU (như kế hoạch của Meta) phải tạm hoãn để đánh giá lại. Vậy là Nvidia “đi bụi” vì hàng loạt GPU đang tồn kho, kể cả các dòng card cũ từ thời crypto vẫn chưa bán hết. :)))))

Nghe đồn trên X (trước đây là Twitter): Trung tâm nghiên cứu AI của Meta (FAIR) những ngày qua khá hỗn loạn. Ban lãnh đạo Meta đang chỉ trích đội ngũ kỹ sư FAIR vì DeepSeek sử dụng nền tảng LLaMA của Meta, nhưng chi phí huấn luyện lại rẻ hơn rất nhiều. Trong khi đó, đội ngũ FAIR đang vội vàng “mổ xẻ” mô hình DeepSeek và các tài liệu liên quan để sao chép bất cứ điều gì có thể. :)))))

Tình hình hiện tại: Mỹ và phương Tây đang thực sự hoang mang trước sự phát triển đột ngột của DeepSeek AI từ Trung Quốc.

Tuy nhiên, không phải tất cả đều lo lắng. Alexandr Wang, CEO gốc Trung của Scale AI, một công ty chuyên cung cấp dữ liệu huấn luyện cho các công ty AI lớn như OpenAI, Anthropic, Google, và thậm chí cả các công ty Trung Quốc như Alibaba, Tencent và DeepSeek, đã đưa ra một góc nhìn khác. Trong một buổi phỏng vấn, anh này cho rằng DeepSeek có thể sở hữu tới 50.000 GPU H100 của Nvidia. Tuy nhiên, số GPU này không được công khai vì Trung Quốc bị Mỹ cấm vận.

Cá nhân mình: Vài tháng trước, mình đã chia sẻ rằng các công ty AI Trung Quốc đang thuê GPU từ các trung tâm dữ liệu tại các nước lân cận như Thái Lan (thuê từ GreenNode của VNG Việt Nam), hoặc từ FPT tại Việt Nam. DeepSeek cũng có thể thuê GPU từ các trung tâm dữ liệu Nvidia hỗ trợ tại Đông Nam Á.

Sự thật: Trung Quốc không thiếu GPU hiệu năng cao để huấn luyện AI. Việc tuyên bố họ dùng GPU “cùi” chỉ là chiêu trò marketing để tạo hiệu ứng “vượt khó”. Thực tế, Trung Quốc không hề thiếu tiền – nghèo thì phải nói đến Việt Nam mới đúng. :)))))

Đột phá AI của Trung Quốc và lợi ích cho Việt Nam

Làm AI có 2 giai đoạn chính:

1. Training (huấn luyện): Giai đoạn này cần số lượng lớn GPU trong vài tháng, nhưng chi phí dễ dự đoán và không yêu cầu kết nối mạng liên tục. Các công ty AI Trung Quốc dễ dàng thuê GPU từ các cloud offshore (các trung tâm dữ liệu đặt ở nước ngoài).
2. Inference (chạy mô hình): Giai đoạn này phức tạp hơn vì phải duy trì kết nối mạng liên tục và đáp ứng số lượng lớn người dùng trong thời gian thực. Đây là phần tốn kém nhất và cũng là lý do khiến DeepSeek phải mở mã nguồn để giảm chi phí.

Liên quan tới Việt Nam: Nvidia đã ký thỏa thuận với Việt Nam để mở trung tâm dữ liệu AI tại đây, tận dụng mạng lưới internet tốt nhất khu vực Đông Nam Á. Hơn nữa, việc vận chuyển GPU từ Đài Loan sang Việt Nam rất nhanh và thuận tiện.

Tóm lại: DeepSeek là minh chứng cho chiến lược của Trung Quốc: tối ưu hóa chi phí để chiếm lĩnh thị trường AI do Mỹ mở rộng. Tuy nhiên, chính sách cấm vận chip của Mỹ đang đẩy Trung Quốc vào những giải pháp không thể kiểm soát, như AI nguồn mở. Điều này sẽ tiếp tục tạo ra những thách thức lớn cho các công ty Mỹ trong tương lai.

-HONG PHUC NGUYEN

❤3

547 viewsedited 06:11

CuongDC 📸

Forwarded from loant.in CHECK VAR

🔔 #Zing | Hai máy bay của Colombia tới Mỹ đón người bị trục xuất
.
⚡instant view⚡
.
Z I N G 🔔

Znews.vn

Hai máy bay của Colombia tới Mỹ đón người bị trục xuất

Colombia đang cử hai máy bay của chính phủ đến đón những người di cư theo kế hoạch ban đầu bị trục xuất trên các chuyến bay quân sự.

517 views06:42

CuongDC 📸

loant.in CHECK VAR

🔔 #Zing | Hai máy bay của Colombia tới Mỹ đón người bị trục xuất . ⚡instant view⚡ . Z I N G 🔔

Vào tháng 1 năm 2025, đã xảy ra một căng thẳng ngoại giao giữa Hoa Kỳ 🇺🇸🇺🇸 và Colombia 🇨🇴🇨🇴liên quan đến việc tiếp nhận người nhập cư bị trục xuất. Tổng thống Colombia, Gustavo Petro, ban đầu từ chối cho phép hai chuyến bay quân sự của Hoa Kỳ chở khoảng 80 người Colombia bị trục xuất hạ cánh, với lý do lo ngại về việc đối xử không nhân đạo với những người này.

Đáp lại, Tổng thống Hoa Kỳ, Donald Trump, đã đe dọa áp đặt mức thuế 25% lên tất cả hàng hóa nhập khẩu từ Colombia và có thể tăng lên 50% trong vòng một tuần nếu Colombia không thay đổi quyết định.

Ngoài ra, Hoa Kỳ cũng áp dụng các biện pháp như cấm vận thị thực đối với các quan chức Colombia và tăng cường kiểm tra hải quan đối với hàng hóa từ Colombia.

Trước áp lực này, chính phủ Colombia đã đồng ý tiếp nhận tất cả công dân bị trục xuất từ Hoa Kỳ mà không có bất kỳ hạn chế nào, bao gồm cả việc chấp nhận các chuyến bay quân sự của Hoa Kỳ.

Tổng thống Petro cũng đề nghị sử dụng máy bay tổng thống để đảm bảo việc hồi hương diễn ra trong điều kiện nhân đạo.

Sau khi đạt được thỏa thuận, Hoa Kỳ đã tạm dừng các biện pháp trừng phạt và thuế quan dự kiến áp đặt lên Colombia.

Sự kiện này được coi là một trong những cuộc xung đột thương mại ngắn nhất trong lịch sử, khi Colombia nhanh chóng nhượng bộ trước các yêu cầu của Hoa Kỳ chỉ trong vài giờ sau khi các biện pháp trừng phạt được công bố.

❤1

566 viewsedited 06:46

CuongDC 📸

SAM NÓI GÌ VỀ DEEPSEEK?

Sam Altman, CEO of OpenAI, đã đăng trên X (trước đây là Twitter) về mô hình R1 của DeepSeek.

Sam mô tả R1 là một mô hình ấn tượng, đặc biệt về khả năng cung cấp với mức giá hợp lý.

Sam nhấn mạnh rằng OpenAI sẽ phát triển các mô hình tốt hơn và bày tỏ sự phấn khởi khi có một đối thủ cạnh tranh mới.

Sam cũng đề cập đến kế hoạch đẩy nhanh việc ra mắt các sản phẩm mới.

Sam tin rằng việc sử dụng nhiều tài nguyên tính toán hơn là quan trọng để đạt được sứ mệnh của OpenAI và dự đoán rằng thế giới sẽ sử dụng rất nhiều AI, đồng thời sẽ ngạc nhiên trước các mô hình thế hệ tiếp theo.

Cuối cùng, Sam bày tỏ mong muốn mang đến cho mọi người trí tuệ nhân tạo tổng quát (AGI) và hơn thế nữa.

568 views07:41

CuongDC 📸

DEEPSEEK DÙNG NHÂN SỰ THẾ NÀO?

Làm cách nào để AI Trung Quốc dù đi sau Mỹ rất nhiều năm, trong bối cảnh “thiếu chip, thiếu tiền, thiếu dữ liệu và môi trường” lại tạo ra một hệ AI tổng quát (GAI) có thể vượt trội so với những mô hình AI tốt nhất của Mỹ, không những thế chi phí đầu tư lại thấp hơn ít nhất 53,5 lần OpenAI?

Đấy là câu hỏi mà những người làm AI, kinh doanh công nghệ của Mỹ cũng như toàn thế giới đang đặt ra câu hỏi và tìm câu trả lời.

Những thiên tài trẻ với sứ mệnh cống hiến

Theo Liang Wenfeng, phụ trách quĩ đầu tư Định lượng Trung Quốc khi tập hợp nhân sự cho DeepSeek, ông không tìm kiếm các chuyên gia AI có kinh nghiệm, không tìm kiếm các người được đào tạo và làm việc ở nước ngoài, ông tập trung vào những nghiên cứu sinh từ các trường đại học hàng đầu Trung Quốc, bao gồm ĐH Bắc Kinh và Thanh Hoa, những người mong muốn chứng tỏ bản thân (hơn là mục tiêu tạo ra sản phẩm để làm giàu), đã giành được giải thưởng tại các hội nghị học thuật quốc tế. Chiến lược tuyển dụng này đã giúp tạo ra văn hóa công ty hợp tác, nơi mọi người được tự do sử dụng nhiều tài nguyên máy tính, trái ngược với văn hóa cạnh tranh tài nguyên của các công ty Internet lâu đời của Trung Quốc.

Hơn nữa, Liang cho rằng sinh viên phù hợp hơn với việc nghiên cứu đầu tư cao, lợi nhuận thấp, bởi với những người trẻ họ có thể cống hiến hoàn toàn cho một sứ mệnh cao cả mà không thực dụng. Liang đã đặt ra sứ mệnh cho những sinh viên tài năng trẻ: “Deep Seek được tạo ra để giải quyết những bài toán khó nhất thế giới”.

Liang cũng truyền cho các bạn trẻ tinh thần yêu nước, mong muốn vượt qua các rào cản về bao vây, cấm vận công nghệ của Mỹ đối với Trung Quốc, cam kết thúc đẩy vị trí của Trung Quốc trong việc dẫn đầu đổi mới, sáng tạo trên toàn cầu.

Vượt qua hạn chế về chip tiên tiến

Tháng 10/2022, Trung Quốc bị cấm nhập khẩu chip tiên tiến như H100 của Nvidia. DeepSeek phải đưa ra một phương pháp luận hiệu quả hơn để đào tạo các mô hình AI của mình, họ đã tối ưu hóa kiến trúc mô hình AI bằng cách sử dụng một loạt thủ thuật kỹ thuật, các sơ đồ giao tiếp tùy chỉnh giữa các con chip, giảm kích thước các trường dữ liệu để tiết kiệm bộ nhớ, yêu cầu sử dụng ít tài nguyên máy tính hơn để đào tạo, sử dụng sáng tạo bằng cách kết hợp các mô hình AI khác nhau. “Nhiều cách tiếp cận này tuy không phải là mới, nhưng kết hợp chúng thành công để tạo ra một mô hình AI tiên tiến trong một khoảng thời gian cực ngắn, với chi phí cực rẻ là một kỳ tích” (kết quả là DeepSeek hiệu quả đến mức nó chỉ cần 1/10 sức mạnh tính toán của LIama 3.1 của Meta).

Đóng góp của DeepSeek cho nhân loại

Việc phát triển các mô hình AI mã nguồn mở là cách duy nhất để Trung Quốc bắt kịp Mỹ, bởi nó thu hút nhiều người dùng và nhiều người đóng góp hơn vào kho mã nguồn mở AI. Kết quả là các nhà nghiên cứu AI Trung Quốc đã đạt được điều mà nhiều người nghĩ là cách nhiều năm ánh sáng: Một mô hình AI mã nguồn mở, miễn phí có thể sánh ngang hoặc vượt qua hiệu suất của các hệ thống suy luận tiên tiến nhất của OpenAI.

Chính vì là mô hình AI mã nguồn mở nên DeepSeek cho phép bất kỳ ai cũng có thể lấy mô hình, sử dụng và sửa đổi nó mà không bị hạn chế. Điều đó đồng nghĩa với việc DeepSeek thực sự mở trao quyền cho tất cả những người phát triển AI trên toàn cầu.

Để kết bài, tôi xin trích lại câu nói rất hay của Arnaud Bertrand: "Về cơ bản, DeepSeek giống như ai đó đã phát hành một chiếc smart phone ngang bằng với iPhone, nhưng đã bán nó với giá 30 đô la thay vì 1000 đô la."

-DO CAO BẢO

557 views08:19

CuongDC 📸

CÁC THUẬT NGỮ OPENSOURCE, WEIGHT, DISTILL KHI THAM KHẢO DEEPSEEK

Trong lĩnh vực lập trình AI, các thuật ngữ “open source”, “weights”, và “distill” có ý nghĩa quan trọng:

1. Open Source (Mã nguồn mở):
• Định nghĩa: Phần mềm hoặc mô hình AI được phát hành với mã nguồn công khai, cho phép bất kỳ ai xem, sửa đổi và phân phối lại.
• Ý nghĩa trong AI: Việc mở mã nguồn mô hình AI, bao gồm cả kiến trúc và trọng số (weights), cho phép cộng đồng nghiên cứu và phát triển cải tiến mô hình, tạo ra các phiên bản tùy chỉnh và thúc đẩy sự đổi mới. Ví dụ, mô hình DeepSeek-R1 được phát hành dưới dạng mã nguồn mở, cung cấp cả mã nguồn và trọng số cho cộng đồng.

2. Weights (Trọng số):
• Định nghĩa: Các tham số trong mô hình học máy quyết định mức độ quan trọng của từng đặc trưng đầu vào trong việc dự đoán đầu ra.
• Ý nghĩa trong AI: Trọng số là kết quả của quá trình huấn luyện mô hình trên dữ liệu; chúng lưu trữ kiến thức mà mô hình đã học được. Việc chia sẻ trọng số của mô hình mã nguồn mở cho phép các nhà phát triển tái sử dụng và tinh chỉnh mô hình cho các ứng dụng cụ thể mà không cần huấn luyện lại từ đầu, tiết kiệm tài nguyên và thời gian.

3. Distill (Trích xuất kiến thức):
• Định nghĩa: Quá trình chuyển giao kiến thức từ một mô hình lớn (thường gọi là “mô hình giáo viên”) sang một mô hình nhỏ hơn (“mô hình học sinh”) nhằm giảm kích thước và tăng hiệu suất mà vẫn duy trì độ chính xác cao.
• Ý nghĩa trong AI: Phương pháp này giúp tạo ra các mô hình nhẹ hơn, phù hợp cho triển khai trong môi trường có tài nguyên hạn chế như thiết bị di động hoặc ứng dụng thời gian thực. Ví dụ, DeepSeek đã sử dụng kỹ thuật trích xuất kiến thức để tạo ra các mô hình nhỏ hơn từ mô hình DeepSeek-R1 ban đầu, giúp duy trì hiệu suất cao trong khi giảm yêu cầu về tài nguyên tính toán.

Việc hiểu rõ các thuật ngữ này giúp các nhà phát triển và nhà nghiên cứu áp dụng hiệu quả các kỹ thuật trong quá trình phát triển và triển khai mô hình AI.

575 views08:31

About

Blog

Apps

Platform