Weekly AI News do Viện công nghệ Blockchain & Trí tuệ nhân tạo ABAII thực hiện, được xuất bản vào mỗi thứ 6 hàng tuần.
Samsung lãi hơn 7 tỷ USD trong quý 2/2024
Samsung Electronics vừa công bố ước tính lợi nhuận hoạt động quý 2/2024 đạt 7,54 tỷ USD, tăng vọt 15 lần so với cùng kỳ năm ngoái và vượt xa dự đoán của giới phân tích. Kết quả kinh doanh khả quan được thúc đẩy bởi nhu cầu chip bán dẫn phục hồi mạnh mẽ, đặc biệt chip cao cấp phục vụ AI. Nhu cầu chip DRAM cao cấp (như HBM dùng trong chipset AI) và chip sử dụng trong trung tâm dữ liệu, thiết bị chạy AI đã đẩy giá bán tăng vọt.
Tuy nhiên, đà tăng giá chip nhớ có thể chững lại trong quý 3 do nhu cầu chip cũ từ thị trường điện tử tiêu dùng vẫn còn yếu.
Hiện Samsung đang chạy đua với SK Hynix trong cuộc chiến cung cấp chip HBM cho các khách hàng lớn như Nvidia. Giới đầu tư đang chờ đợi thông tin về việc liệu chip HBM thế hệ thứ tư của Samsung có được Nvidia chấp thuận cung cấp hay không.
LPUs: cuộc cách mạng tốc độ xử lý ngôn ngữ trong AI
LPUs (Language Processing Units), bộ xử lý chuyên dụng cho các tác vụ ngôn ngữ, đang nổi lên như một công nghệ đột phá, hứa hẹn cách mạng hóa lĩnh vực AI. Groq, công ty tiên phong tạo ra LPU, tuyên bố công nghệ này mang đến tốc độ xử lý nhanh hơn 10 lần, độ trễ thấp hơn 90% và tiêu thụ năng lượng ít hơn so với GPU truyền thống.
LPU được thiết kế để xử lý các tác vụ ngôn ngữ phức tạp và đa dạng một cách nhanh chóng, chính xác. Ứng dụng tiềm năng của LPU là nâng cao AI dịch vụ khách hàng, chuyển đổi giọng nói thành văn bản và ngược lại theo thời gian thực, mang đến trải nghiệm tự nhiên và hiệu quả hơn.
Mặc dù tiềm năng to lớn, việc tích hợp LPU vào hệ thống hiện tại cũng đặt ra một số thách thức, như đảm bảo tính tương thích và vấn đề đạo đức trong sử dụng AI.
TSMC đạt vốn hoá hơn 1.000 tỷ USD
TSMC, nhà sản xuất chip khổng lồ Đài Loan, đã ghi dấu ấn lịch sử khi giá trị vốn hóa thị trường vượt mốc 1.000 tỷ USD sau phiên giao dịch sôi động đầu tuần, củng cố vị thế thống trị trong ngành công nghiệp bán dẫn toàn cầu. Giá cổ phiếu TSMC niêm yết tại Mỹ (ADR) tăng vọt gần 5% trong phiên giao dịch ngày 8/7, và đã tăng gần 80% kể từ đầu năm nay.
Vị thế độc tôn của TSMC với tư cách là nhà cung cấp duy nhất các con chip quan trọng nhất cho Apple Inc. và Nvidia – hai “gã khổng lồ” công nghệ trị giá 3.000 tỷ USD, đã biến công ty trở thành lựa chọn đầu tư hấp dẫn trong bối cảnh làn sóng phát triển AI bùng nổ. Bất chấp căng thẳng địa chính trị leo thang ở eo biển Đài Loan, nhiều công ty chứng khoán phố Wall vẫn nâng mục tiêu giá cho TSMC. Họ tin rằng nhu cầu chip AI tăng vọt và tiềm năng tăng giá bán sản phẩm vào năm 2025 sẽ thúc đẩy lợi nhuận của TSMC.
OpenAI đòi New York Times chứng minh nguồn gốc bài báo trong vụ kiện
Giữa vụ kiện về việc sử dụng trái phép nội dung để huấn luyện AI, OpenAI bất ngờ yêu cầu New York Times (NYT) chứng minh quyền tác giả cho các bài báo được cho là đã bị vi phạm.
Vụ kiện bắt nguồn từ cáo buộc của NYT cho rằng OpenAI đã sử dụng các bài viết của mình để huấn luyện mô hình AI mà không xin phép hay bồi thường. OpenAI phản bác, cho rằng việc sử dụng các tài liệu “thu thập” từ internet là hợp lý.
Ngày 1/7, luật sư của OpenAI đã đệ đơn lên tòa án New York, yêu cầu thẩm phán giám sát vụ án buộc NYT chứng minh quyền tác giả đối với “các tác phẩm được bảo hộ bản quyền”.
Phía NYT đã phản đối yêu cầu này, cho rằng nó “chưa từng có” và “lật ngược luật bản quyền”. Luật sư của NYT khẳng định cách thức tạo ra tài liệu có bản quyền không liên quan đến cách thức sử dụng tài liệu đó trong trường hợp này. Nếu tòa án chấp thuận yêu cầu của OpenAI, có thể tạo ra tiền lệ pháp lý mới, buộc các nhà xuất bản phải tiết lộ quy trình sáng tạo nội dung khi đệ đơn kiện vi phạm bản quyền.
Token và giới hạn của mô hình AI hiện nay
Quá trình xử lý ngôn ngữ dựa trên “token” của mô hình AI thế hệ mới đang bộc lộ nhiều hạn chế, đặt ra rào cản lớn cho sự phát triển của lĩnh vực này.
Thay vì xử lý văn bản thô như con người, mô hình AI dựa trên kiến trúc transformer vận hành bằng cách mã hóa dữ liệu thành các đơn vị nhỏ hơn gọi là “token.” Token có thể là từ, âm tiết hoặc thậm chí là từng ký tự riêng lẻ. Quá trình này, được gọi là tokenization, cho phép AI tiếp nhận thông tin hiệu quả hơn, nhưng đồng thời cũng tạo ra nhiều hạn chế.
Một trong những thách thức chính là sự thiếu nhất quán trong cách token được xử lý, dẫn đến kết quả không chính xác. Hơn nữa, việc phân biệt chữ hoa, chữ thường, khoảng trắng… cũng tạo ra sự khác biệt đáng kể. Vấn đề càng trở nên trầm trọng hơn khi xét đến các ngôn ngữ khác ngoài tiếng Anh.
Tokenization cũng là nguyên nhân khiến mô hình AI hiện tại gặp khó khăn trong việc xử lý toán học do không thực sự hiểu về số.
Mặc dù gặp nhiều thách thức, các nhà khoa học đang tích cực nghiên cứu giải pháp khả thi. Mô hình không gian trạng thái “byte-level” như MambaByte, có khả năng xử lý trực tiếp dữ liệu thô ở dạng byte, cho thấy tiềm năng vượt trội trong việc xử lý “nhiễu” ngôn ngữ và phân tích văn bản hiệu quả hơn.
Roblox tăng cường an toàn cộng đồng bằng AI
Roblox giới thiệu hệ thống ML theo dõi vi phạm chính sách trong giao tiếp giọng nói, nhằm tạo ra môi trường trực tuyến an toàn và văn minh.
Hệ thống “Giám sát thời gian thực” (Real-time Safety) hoạt động dựa trên mô hình học máy, xử lý hàng triệu phút hoạt động thoại mỗi ngày. Hệ thống này có khả năng phát hiện vi phạm chính sách trong giao tiếp bằng giọng nói với độ chính xác cao hơn so với kiểm duyệt bởi con người. Hệ thống hoạt động dựa trên việc phân tích cả hai yếu tố gồm phong cách âm thanh (bao gồm âm lượng, ngữ điệu) và nội dung được nói. Sau khi phát hiện vi phạm, hệ thống sẽ gửi cảnh báo tới người dùng. Nếu hành vi đó tiếp tục diễn ra, Roblox sẽ áp dụng các biện pháp mạnh tay hơn.
Roblox đã phải vượt qua nhiều thách thức về dữ liệu để xây dựng hệ thống này, trong đó có việc kết hợp dữ liệu được gắn nhãn tự động cho quá trình huấn luyện và dữ liệu được gắn nhãn thủ công cho quá trình đánh giá.
Kết quả sau triển khai cho thấy hệ thống đã giúp Roblox giảm đáng kể hành vi vi phạm chính sách trên nền tảng: giảm 15.3% số lượng báo cáo lạm dụng bằng giọng nói ở mức độ nghiêm trọng và giảm 11.4% số vi phạm trên mỗi phút thoại.
Roblox đang tiếp tục nghiên cứu và cải tiến “Giám sát thời gian thực”, bao gồm việc mở rộng khả năng hỗ trợ đa ngôn ngữ.