Quan hệ đối tác dữ liệu OpenAI hy vọng sẽ thu hẹp khoảng cách trong đào tạo AI



Chúng tôi là công ty Công nghệ Terus, Công ty thiết kế website uy tín tại Hồ Chí Minh và cung cấp các dịch vụ liên quan đến digital. Terus đem tới các dịch vụ: Thiết kế websitedịch vụ quảng cáo Facebook Adsdịch vụ chạy quảng cáo Google Adsdịch vụ SEO tổng thể,...

OpenAI đã công bố sáng kiến ​​“Quan hệ đối tác dữ liệu ”, với mục đích mở rộng tính đa dạng của dữ liệu đào tạo AI vượt ra ngoài chuẩn mực lấy phương Tây làm trung tâm. Chương trình đột phá này được thiết kế để hợp tác với nhiều tổ chức khác nhau nhằm phát triển các tập dữ liệu công khai và riêng tư toàn diện cho đào tạo mô hình AI.

Giải quyết sự thiên vị dữ liệu trong AI Sáng kiến ​​này ra đời nhằm ứng phó với vấn đề phổ biến về sự thiên vị dữ liệu trong AI. Các mô hình AI truyền thống đã cho thấy sự thiên vị đáng kể đối với dữ liệu từ các nước phương Tây, đặc biệt là trong cơ sở dữ liệu hình ảnh. Sự thiên vị này là do sự thể hiện quá mức của hình ảnh phương Tây trên internet, dẫn đến các mô hình AI vô tình khuếch đại những sự thiên vị này, có khả năng dẫn đến những kết quả có hại.

Quan hệ đối tác dữ liệu của OpenAI hướng đến mục tiêu khắc phục điều này bằng cách thu thập các tập dữ liệu mở rộng phản ánh chính xác hơn xã hội loài người toàn cầu. Các tập dữ liệu này sẽ tập trung vào việc nắm bắt ý định của con người thông qua nhiều định dạng khác nhau như các bài viết hoặc hội thoại mở rộng trên nhiều ngôn ngữ và chủ đề khác nhau. Tập dữ liệu mở rộng này sẽ hỗ trợ các mô hình AI đạt được sự hiểu biết sâu sắc hơn về nhiều chủ đề, ngành công nghiệp, văn hóa và ngôn ngữ khác nhau.

Thu thập dữ liệu công khai và riêng tư Chương trình sẽ hoạt động trên nhiều phương thức, bao gồm hình ảnh, âm thanh và video, ưu tiên dữ liệu thể hiện ý định của con người, chẳng hạn như văn bản dài hoặc hội thoại. Để đảm bảo tính toàn vẹn của dữ liệu, OpenAI có kế hoạch sử dụng các công cụ như Nhận dạng ký tự quang học và Nhận dạng giọng nói tự động để số hóa, đồng thời lưu ý xóa thông tin nhạy cảm hoặc thông tin cá nhân. OpenAI có kế hoạch phát triển hai loại tập dữ liệu . Loại đầu tiên là tập dữ liệu nguồn mở, sẽ được cung cấp miễn phí cho mục đích đào tạo AI. Loại thứ hai là tập dữ liệu riêng tư, được thiết kế riêng cho các tổ chức muốn duy trì tính bảo mật của dữ liệu trong khi cho phép các mô hình OpenAI hiểu rõ hơn về các miền cụ thể của họ.

Sự hợp tác và tranh cãi Công ty đã bắt tay vào các quan hệ đối tác để nâng cao năng lực AI của mình. Sự hợp tác với chính phủ Iceland và Miðeind ehf đã cải thiện trình độ tiếng Iceland của GPT-4. Tương tự như vậy, quan hệ đối tác với Dự án Luật miễn phí đã nâng cao khả năng hiểu các văn bản pháp lý của mô hình. Mặc dù sáng kiến ​​này có vẻ vị tha, OpenAI vẫn phải đối mặt với sự chỉ trích vì động cơ thương mại tiềm ẩn. Cách tiếp cận cải thiện các mô hình của OpenAI, có khả năng gây tổn hại đến người khác mà không có sự đền bù công bằng, đã gây ra nhiều tranh cãi. Các hành động pháp lý gần đây chống lại OpenAI và Microsoft của những người sáng tạo và tác giả đã nêu bật các vấn đề liên quan đến việc sử dụng trái phép các tác phẩm của họ để đào tạo các mô hình AI, đặt ra câu hỏi về việc sử dụng dữ liệu có đạo đức và đền bù trong ngành AI.

Các dịch vụ tại Terus Technology:

Thiết kế website

Thiết kế website bán hàng

Dịch vụ SEO website

Dịch vụ chạy quảng cáo Facebook Ads

Dịch vụ chạy quảng cáo Google Ads