Trong các cuộc tranh luận về tương lai của trí thông minh nhân tạo, nhiều chuyên gia nghĩ rằng các hệ thống mới là hợp lý lạnh lùng và khách quan hợp lý. Nhưng trong một nghiên cứu mới, các nhà nghiên cứu đã chứng minh làm thế nào máy móc có thể phản chiếu của chúng ta, người sáng tạo của họ, theo những cách có thể có vấn đề. Các nhà nghiên cứu nhận thấy các chương trình học máy phổ biến, khi được đào tạo bằng ngôn ngữ bình thường trực tuyến trên con người, có thể có được những thành kiến văn hóa nhúng trong các từ ngữ. Những thành kiến này bao gồm từ trung tính về mặt đạo đức, giống như sự ưa thích hoa hơn côn trùng, với quan điểm phản đối của chủng tộc và giới tính.
Chủ Nhật, 16 tháng 4, 2017
THACH
» Những thành kiến của con người nhìn vào các hệ thống trí tuệ nhân tạo
Những thành kiến của con người nhìn vào các hệ thống trí tuệ nhân tạo
Đăng vào lúc : 4/16/2017 02:13:00 SA |  in WHO
Xác định và giải quyết các thiên lệch có thể có trong học máy sẽ rất quan trọng khi chúng ta ngày càng chuyển sang các máy tính để xử lý ngôn ngữ tự nhiên mà con người sử dụng để giao tiếp, ví dụ như trong việc tìm kiếm văn bản trực tuyến, phân loại hình ảnh và dịch tự động.
Nhà nghiên cứu Arvind Narayanan, trợ lý giáo sư về khoa học máy tính và là thành viên của khoa tại Trung tâm Chính sách Công nghệ Thông tin (CITP) tại Đại học Princeton cho hay, "Các câu hỏi về sự công bằng và thiên vị trong học tập máy móc là rất quan trọng đối với xã hội chúng ta. Một học giả liên kết tại Trung tâm Internet và Xã hội Stanford Law School. "Chúng ta có một tình huống mà những hệ thống trí tuệ nhân tạo này có thể làm mất lịch sử của các thiên kiến mà chúng ta có thể thấy là không thể chấp nhận được về mặt xã hội và chúng ta có thể cố gắng tránh xa".
Bài báo, "Ngữ nghĩa học thu được tự động từ tập hợp ngôn ngữ có chứa những thành kiến giống như con người", xuất bản ngày 14 tháng 4 của tạp chí Khoa học . Tác giả chính của nó là Aylin Caliskan, một cộng sự nghiên cứu tiến sĩ và là một đồng nghiệp của CITP tại Princeton; Joanna Bryson, một độc giả của Đại học Bath, và chi nhánh của CITP, là đồng tác giả.
Là một chuẩn mực cho những thành kiến của con người, nghiên cứu chuyển sang thử nghiệm Hiệp hội ngấm ngầm, được sử dụng trong nhiều nghiên cứu tâm lý xã hội kể từ khi nó được phát triển tại Đại học Washington vào cuối những năm 1990. Đo kiểm đo thời gian phản hồi (tính bằng mili giây) của các đối tượng người yêu cầu ghép nối các khái niệm từ được hiển thị trên màn hình máy tính. Thời gian đáp ứng ngắn hơn, bài kiểm tra Hiệp hội ngụ ý đã nhiều lần cho thấy, khi các đối tượng được yêu cầu ghép hai khái niệm mà chúng tìm thấy tương tự, so với hai khái niệm mà chúng thấy không giống nhau.
Lấy các loại hoa, như "hoa hồng" và "daisy", và côn trùng như "kiến" và "bướm đêm." Những từ này có thể kết hợp với các khái niệm dễ chịu, như "vuốt ve" và "tình yêu", hoặc các khái niệm khó chịu, như "bẩn thỉu" và "xấu xí". Con người nhanh chóng liên kết các từ hoa với các khái niệm dễ chịu và các thuật ngữ côn trùng với những ý tưởng khó chịu.
Nhóm Princeton đã đưa ra một thử nghiệm với một chương trình mà nó thực chất hoạt động giống như một phiên bản học máy của bài kiểm tra Hiệp hội Tích cực. Được gọi là GloVe, và được phát triển bởi các nhà nghiên cứu thuộc trường đại học Stanford, chương trình mã nguồn mở phổ biến là một loại mà một công ty học về máy khởi động có thể sử dụng ở trọng tâm của sản phẩm. Thuật toán GloVe có thể đại diện thống kê xảy ra đồng thời của các từ trong, ví dụ, một cửa sổ văn bản gồm 10 từ. Những từ thường xuất hiện gần nhau có mối liên hệ mạnh mẽ hơn những từ hiếm khi làm.
Các nhà nghiên cứu thuộc Đại học Stanford đã biến GloVe lỏng lẻo trên một lưới kéo khổng lồ nội dung từ World Wide Web, chứa 840 tỷ từ. Trong một mẫu văn bản văn bản rộng lớn này, Narayanan và các đồng nghiệp đã khảo sát các bộ từ được gọi là "các lập trình viên, kỹ sư, khoa học gia" và "y tá, giáo viên, thư viện" cùng với hai bộ từ thuộc tính, chẳng hạn như " Nam "và" phụ nữ, phụ nữ ", tìm kiếm bằng chứng về những loại thiên vị mà con người có thể vô tình sở hữu.
Trong các kết quả, những sự thiên vị vô hại, vô hại, như những bông hoa trên những con bọ, đã xuất hiện, nhưng những ví dụ đó cũng đã làm theo các dòng giới tính và chủng tộc. Hóa ra, thử nghiệm học máy Princeton đã cố gắng nhân rộng các chứng minh rộng rãi của sự thiên vị trong các cuộc nghiên cứu lựa chọn các bài kiểm tra Hiệp hội Tích cực trong nhiều năm dựa vào các đối tượng sống, con người.
Chẳng hạn, chương trình học máy liên quan đến nữ giới nhiều hơn với các từ thuộc tính gia đình, như "bố mẹ" và "đám cưới", hơn là các tên đàn ông. Đổi lại, tên đàn ông có mối liên hệ mạnh mẽ hơn với các thuộc tính nghề nghiệp, như "chuyên nghiệp" và "tiền lương". Theo báo cáo của Phòng Thống kê Lao động Hoa Kỳ, các kết quả như vậy thường chỉ là những phản ánh khách quan về sự phân bố thực sự và không công bằng của các loại hình nghề nghiệp đối với giới như 77 phần trăm các lập trình viên máy tính là nam giới.
Tuy nhiên, sự thiên vị phân biệt chính xác về nghề nghiệp này có thể dẫn đến những hậu quả có hại cho giới tính. Ví dụ: khi ngoại ngữ được xử lý ngây thơ bởi các chương trình học máy, dẫn đến các câu ngớ ngàng về giới. Tiếng Thổ Nhĩ Kỳ sử dụng một đại từ trung lập giới tính thứ ba, "o". Tuy nhiên, câu chữ Thổ Nhĩ Kỳ "o bir doktor" và "o bir hem ire" với từ đại từ trung tính này được dịch sang tiếng Anh là "ông ấy là bác sĩ" và " cô ấy là một y tá."
Hanna Wallach, một nhà nghiên cứu cao cấp của Microsoft Research New York City, cho biết: "Bài báo này nhắc lại một điểm quan trọng rằng các phương pháp học máy không" khách quan "hay" không thiên vị "chỉ vì họ dựa vào toán học và các thuật toán. học. "Thay vào đó, miễn là họ được đào tạo bằng cách sử dụng dữ liệu từ xã hội và chừng nào xã hội còn có những thành kiến, những phương pháp này sẽ tạo ra những thành kiến này".
Một ví dụ khác có thể bị phản đối gợi ý về một bài báo nổi tiếng năm 2004 của Marianne Bertrand thuộc trường Đại học Chicago Booth School of Business và Sendhil Mullainathan của Đại học Harvard. Các nhà kinh tế đã gửi gần 5.000 bản lý lịch giống nhau tới 1.300 quảng cáo việc làm, chỉ thay đổi tên của những người nộp đơn là một trong hai người Mỹ gốc Châu Âu hoặc châu Mỹ. Nhóm cựu là 50 phần trăm nhiều khả năng được cung cấp một cuộc phỏng vấn hơn sau này. Trong một khẳng định rõ ràng về sự thiên vị này, nghiên cứu mới của Princeton đã chứng minh rằng một tập hợp các tên người Mỹ gốc Phi có nhiều mối quan hệ khó chịu hơn so với một bộ đồ châu Âu.
Các lập trình viên máy tính có thể hy vọng ngăn chặn được sự tồn tại lâu dài của văn hoá thông qua việc phát triển các hướng dẫn rõ ràng, dựa trên toán học cho các chương trình học máy dưới các hệ thống AI. Không giống như cách các bậc cha mẹ và cố vấn cố gắng thấm nhuần các khái niệm về sự công bằng và bình đẳng ở trẻ em và học sinh, các nhà lập trình có thể cố gắng làm cho máy móc phản ánh các thiên thần tốt hơn của bản chất con người.
Ông Narayanan nói: "Những thành kiến mà chúng tôi nghiên cứu trong bài báo dễ dàng bỏ qua khi các nhà thiết kế đang tạo ra các hệ thống. Thay vì cố gắng sanitize hoặc loại bỏ chúng, chúng ta nên coi các thành kiến như là một phần của ngôn ngữ và thiết lập một cách rõ ràng trong việc học máy để xác định những gì chúng ta cho là chấp nhận được và không thể chấp nhận được."
Nguồn:
Vật liệu do Đại học Princeton, Trường Kỹ thuật cung cấp . Lưu ý: Nội dung có thể được chỉnh sửa cho phong cách và chiều dài.
Share this post
Nên Nhớ: Phương trình là mãi mãi.Sự khác biệt giữa quá khứ, hiện tại và tương lai chỉ là một ảo tưởng dai dẳng dẫn đến ngoan cố. Mong các bạn góp ý. Google+.


0 nhận xét:
Đăng nhận xét