【2021.9.19更新】
馬來西亞的陸君奕先生在《萍聚》原作者~作曲的嚕啦啦11期傅傳傑先生以及作詞的嚕啦啦11期戴榮旭先生的遺孀李玲玲女士出面說明之後,來訊表示對他們很抱歉,並對自己之前信中所言作出以下的解釋:
1985年,知識報出的題目是真的,那時候我才六年級,就把萍聚的歌詞填上去拿獎,結果,誤會就此產生。
那時候全校的同學都以為是我寫的歌,誤會鬧得更大。於是我就當成是我寫的,一個小學生的心態。
直到初中,萍聚這首歌在全世界流行起來,第二個誤會又產生了,我就以為我寫的歌給歌手唱出來了。
誤會一直延續下去,直到我遇到有人跟我說,萍聚在很久以前,已經有人在唱。我就覺得奇怪,為什麼時間不吻合的,但那時,網絡資訊還不發達,我的疑問一直無法解答。
後來,馬來西亞又有傳言說萍聚寫詞人來自吉隆坡尊龍獨中,我的誤會又給放大了,是不是在找我?
網上搜索,萍聚歌詞的原創是個謎,也有人在blog留言尋找嚕啦啦。誤會又來了,我人生哪裡可以得到安靜!
所以我在信裡面提到的事情,一直得不到答案,直到看到你們的貼文,我才確定了錯誤點發生在哪裡,就是小學時候的我所犯的錯誤。
人生的記憶是不能騙人的,假如我在中學時期就確定,歌詞是有主人的,我就沒有今天的誤會和錯誤。
【2021.9.17更新】
嚕啦啦23期王慕榕來函表示,他已與11期傅傳傑學長聯繫上,也告知目前討論的情況。傳傳傑先生確認《萍聚》是由他譜曲,並由同為11期的戴榮旭先生填詞,兩人共同創作完成。
萍水相逢,
有緣相聚!
就是「萍聚」歌名的緣由
【2021.9.17更新】
救國團團康活動歌本上記載的《萍聚》作者戴榮旭的遺孀李玲玲女士來函如下:
張先生您好
我是嚕啦啦十一期戴榮旭的太太
看到這麼多人在談論「萍聚」
實在覺得遺憾
我先生戴榮旭
在民國91年已經過世
所以也無從查證
想請您再詢問曲譜上
寫的作曲人傅傳傑先生
看他是否還記得
當年一同創作萍聚這首歌曲的
戴榮旭?
我很確定的是
民國63-66年左右
在榮旭讀五專時期
他的確時常在救國團服務帶隊
戴榮旭帶過許多霧社先鋒團的
各校年輕朋友
相信很多人都會記得他
他生前也告訴過我
他曾寫了《萍聚》這首歌
但是當時沒有智慧財產權等法規
隨著他的逝世
我想也就無法
再做什麼說明或澄清了
謝謝大家的熱情及支持
我相信
只要我們曾經擁有過
對你我來說已經足夠
感恩
【2021.9.15更新】
謝謝提供相關資訊的網友們,我特地將有關《萍聚》作者的資料整理出來和大家分享:
早在1970年代救國團活動的團康歌本裡就已出現《萍聚》這首歌,上面記載的作者為嚕啦啦11期戴榮旭。
而在YouTube 有一個上傳於2017年4月底,由嚕啦啦13期之敏和11期傳傑合唱《萍聚》的影片(https://youtu.be/j-4ThaLm0NU),上面記載《萍聚》的作者是嚕啦啦11期的戴榮旭(作詞)和傅傳傑(作曲)。
不過在2009年有新聞媒體報導,宜蘭一位音樂老師孫正明聲稱自己才是《萍聚》的作曲者,創作時間為1967年,而作詞者則是當時的兩位救國團輔導員。(新聞連結:https://news.tvbs.com.tw/life/119642)
另外,已故歌手江明學曾於2017年在YouTube影片(https://youtu.be/uHS7tjCQTsw)留言處回覆網友詢問他是否為萍聚的作者時提到:
萍聚的詞曲作者是嚕啦啦,嚕啦啦是一個筆名,這首歌四十年前開始在台灣的團康活動傳唱,至今都還沒找到真正原作者!網路上流傳著各種傳說⋯⋯,我印象中曾經三位人士出來表示自己是原作者,但是因為說法都不夠令大眾及版權團體信服,也都拿不出有力的證據,結果全不了了之。因為當年使用過的正版唱片公司,都有提存了一筆詞曲費用在銀行的專戶,多年下來已累積了一筆不小的數字,所以一定要有人、事、物的確定證據,才能領走這筆錢!
如果您也有關於《萍聚》作者的資訊,歡迎您留言或私訊告訴我,謝謝。
——————
今晚我要跟大家分享來自馬來西亞的陸君奕先生的一封信,他在信中表示,他才是華語歌曲《萍聚》的詞曲作者,以下是他的來信全文:
張哲生大哥你好,
小弟陸君奕今年48歲,來自馬來西亞怡保,有一件事情埋藏在我身上已經 36年,一點也不虛假,是我人生經歷過的事情。
1985年,當時我小學六年級,因為學校販賣的報紙(名字叫《知識報》)上頭的一個填歌詞遊戲環節,讓我寫成了一首歌的歌詞,後來有人把它取名《隨緣聚首》,也有人把它取名《萍聚》。
我不曉得為什麼網上把《萍聚》說是1967年創作的歌呢?
(編按:根據2009年1月27日的TVBS新聞報導,宜蘭一位音樂老師孫正明表示自己是《萍聚》的作曲人,他說,1967年夏天,他就讀師大二年級,在偶然機會下,接受兩名救國團輔導員委託,為他們寫的《萍聚》歌詞譜曲,當時師大音樂系風氣保守,禁止學生私自參加校外比賽和活動,所以他才沒在創作上留名。)
以下是我當年寫《萍聚》這首歌的來龍去脈,記憶猶新。
1985年,那時候,我還是一名六年級學生,萬里望萬華二校小學有販賣華文報《知識報》,我是它的忠實讀者;報章第二頁印著有獎遊戲環節題目,題目通常都很簡單,學生只要填對答案,再填寫學校名稱、姓名、班級,然後寄到報館,相隔幾期後,幸運的話會有意想不到的驚喜,例如收到禮物。
就是這一年,春節過了,月考也過了,所以學生們在班上有許多悠閒的時間,這一期《知識報》的有獎遊戲題目顯然不簡單,題目是讓學生們嘗試寫歌詞的機會!
只有一個空白的四方格留在題目下面,方格上面有一段已經寫好詞語 :「別管以後將如何結束」,四方格下面用比較小的字寫著參賽條規:
(1) 歌詞需要 50/60 個字(已經想不起是50還是60)
(2) 參賽者必須把所有草稿紙都一起跟寫好的歌詞寄去參賽
(那時候我還小,不懂原因,現在懂了,為了確保歌詞是真的本人寫的,我還記得曾經從垃圾桶撿回草稿紙再弄乾淨。)
我起初看過題目後,沒有頭緒,還未想到什麼,不把它當成一回事,直到有一天放學,我在禮堂等父母來接我回家。
放學時段,學校鼓笛隊時常在禮堂旁邊訓練,這天我聽到他們剛開始訓練時有一段交響曲,只有鼓聲響,其它樂器沒有,很自然地,我就念出一句詞語:「至少我們曾經相聚過」,也同時候聯想起《知識報》的題目:「別管以後將如何結束」。
這時候發現兩句好像有押韻,於是興趣來了,我認真聽著交響曲,再念了一遍這兩句,欸!非常押韻 !
我有了新玩意,寫歌詞,對,有興趣寫歌詞!! 我得想個辦法怎樣才能想到第三句,我數學分數名列前茅,第一句和第二句同樣有九個字,我決定利用 9x9 的表格來想歌詞。
回到家裡,用畫圖用的大白紙,畫成很多橫線和直線,每一行9個格,後來我改用學校的練習簿,學生們都稱呼它為大方格簿。
寫歌詞的方法找到了,就是好像上華文科一樣造句,只不過造句每一行都必須9個字。
第二天,在學校科室裡,我很快就想到第三句:「對你我來講已經足夠」,可惜這一句不能夠連接我之前的詞語,不押韻,但是我把它保留下來,繼續想第三句歌詞。
有一次開週會,看到兩位女學生互相責罵對方,聲音惹來老師前來看個究竟,經過老師的教導,女生們都互相承諾,說以後不敢再犯錯。
我人在附近望著,從他們的對話中,我心裡有點靈感,想到一些詞彙,他們互相承諾,又彼此約束;我默默地想一想怎樣用上述的詞彙造個9個字的句子,於是想到啦 !「不必費心地彼此約束,更不需要言語的承諾。」
一下子,想到兩句歌詞,押韻嗎?心裡想一想跟之前的有一點押韻,然後在心中暗念了一遍:
別管以後將如何結束
至少我們曾經相聚過
不必費心地彼此約束
更不需要言語的承諾
我覺得押韻也很滿意!
學校的環境清幽,當我回到科室後,只能再暗中從心裡用唱歌的形式唱一遍,我覺得歌的韻律跑出來,歌詞也同時帶出涵義。
對,我真的很滿意歌詞寫到現在的情況。再說,我對寫歌詞的興趣也大大提升!很好玩呢!
在學校嘴巴閉了那麼久,放學回到家裡,終於可以放大聲唱出這些歌詞。我擔心用詞不當,我問爺爺「彼此」是什麼意思,爺爺解釋說:「你我、雙方,或者敵對」,同時我也學會一句「知己知彼,百戰百勝」。
想歌詞到現在,4乘9,只有36個字,還得繼續想⋯⋯
一天又一天過去,想不出什麼,沒靈感,怎麼辦 ?
另外,我們陸家的家教很嚴,第一個家規就是不能碰毒品,誰沾染毒品就馬上被踢出陸家,所以爸爸和爺爺都常灌輸思維,做人要知足常樂。
我爺爺是寫詩人,讀春秋書籍,萬里望升旗山,山水觀音亭的詩詞是我爺爺遺留下來的,他的筆名是浩然,原名陸其廣。事實上,歌名「萍聚」是我爺爺取的名字,這還有一段故事可以講,不過以後再說吧!
那時候,我家經營萬里望有名氣的醬油廠,家中環境還算不錯,有錄影機、唱機,錄影帶和卡帶都有很多,那時候流行的歌手有台灣的林淑容Anna、香港的譚詠麟Alan。
受到 Anna 這個英文名字的啓發,我取了 LULALA 作為筆名,主要是因為我性格內向,怕別人嘲笑,所以不敢用真實名字,而用 LULALA 來代替。
然後,我到房間放卡帶的地方參考看看有什麼詞語可以用得上。 就看到一個字「擁」。這時候,我想起第二天想到的那句「對你我來講已經足夠」,於是,造句靈感來了:「只要我們曾經擁有過」,我發現將這兩句歌詞合併,不就是代表知足常樂的意思嗎?
好的,重新排列歌詞:
別管以後將如何結束
至少我們曾經相聚過
不必費心地彼此約束
更不需要言語的承諾
只要我們曾經擁有過
對你我來講已經足夠
在我想歌詞及韻律的時候,發現「相聚過」和 「擁有過」是可以互換位置來唱的 !但是最後我總覺得,人還是要相聚過,才能夠擁有。
歌詞想到這裡,因為作詞的興趣濃厚,無論是在學校還是在家裡,我也不怕羞恥,朗朗上口地把歌詞唱一遍,所以那時,學校有許多老師都知道我曾經寫過一首歌。記得有一次,一位女老師到班上教科(現在已經想不起老師名字),我非常大膽地跟老師說,我有一件事情要做,要不然我會後悔一輩子!老師脾氣真好,不但沒有責怪我,還讓我完成這事情,就是寫完歌詞,老師只是溫柔地提醒我,下一個月考快要到,要快點專心讀書。
這時候的歌詞已有7乘9,共63個字,可以想結尾的歌詞了!畢竟再不專心聽課,老師肯定會責罵我。
我的座位在科室最前排,偏向窗口,萬華小學當時只有一排科室有兩層樓,我的科室在樓上。學校地理位置在萬里望小鎮的正中央,所有本地人辦喪事的出殯隊伍都必須經過小學的大路,小學生都很怕聽到出殯隊伍的敲鑼打鼓聲。
我感慨地想到一句連我自己都會流出眼淚的詞語:「人的一生有許多回憶,只願你的追憶有個我」。
前前後後,我用了21天寫成歌詞,然後將成品連同草稿紙寄去參賽,大概一個月後,成績出來,我拿了冠軍,學校也把那張《知識報》張貼在學校禮堂。
【別管以後將如何結束】
【至少我們曾經相聚過】
【不必費心地彼此約束】
【更不需要言語的承諾】
【只要我們曾經擁有過】
【對你我來講已經足夠】
【人的一生有許多回憶】
【只願你的追憶有個我】
這首歌詞很單純地是一個小學六年級,身材略胖的男生的作品;
它只不過是《知識報》遊戲環節的一部分,是無心插柳之作。
得獎後,馬上有來自台灣的人找我,印象最深刻的是江明學,是他教我江字怎樣念,他說跟將來的將同音。
他是第一個要求把歌詞拿去唱的人,我猜《隨緣聚首》這個最初的歌名應該就是他取的吧!他還要求把歌詞裡「的」這個字唱得不一樣,各位可以聽聽他唱的版本。
另外,當時還有人站在我旁邊,要我把歌詞認真唱一遍,他就抄下音符,假如可以聯絡到作曲人孫正明,或許能得到解答。
我那時候還跟他們說,回去台灣找個姓李的人,為他取我的名字當藝名,他一定會把這首歌給唱紅;後來上華唱片為李華苓取個藝名叫李翊君,「翊君」二字恰好是我的名字「君奕」倒過來念。
音符抄完後,他還問我,這首歌你是想單人唱或者是雙人唱,我想一想就問:「可不可以男女合唱?女聲清脆,女先唱,男聲粗壯,跟隨在後,就這樣一前一後,我覺得比較好聽。」我還強調一定要用小鼓作為主要樂曲。
而後來李翊君唱的版本,就和我認真唱的這個版本的音調一模一樣!
所以除了江明學以外,我非常肯定娛樂圈一定有人知道誰是 LULALA,他們肯定有來過我現在住的地方~怡保萬里望。
翌年,1986年,快要上中學,我複印一份寫著我名字和學校名稱的《知識報》放進一個白色信封,信封上我寫上三道題 :
1、萍聚是什麼?
2、萍聚有多少個字?
3、萍聚是誰取的名字?
再托付給爺爺保管,還跟爺爺說等我長大以後交還給我,好讓我留給我的兒孫看。
還有一件事情,我除了把歌詞寄去《知識報》參賽,也另外寄了一份我親手寫的歌詞在白紙上,再寫上我的筆名LULALA,寄去香港 TVB,我還在信封後面留下回郵地址。
1986年,某一天,我家人租錄影帶回家看,是歌唱綜藝節目,鄭裕玲主持,節目的後段,她把我寄過去的歌詞念了一遍,用廣東話說了一句:「你以為香港沒人才,膽敢把歌詞寄來 TVB。」她也提到這封信是來自南洋的。
小學和中學,相比之下真是天淵之別,中文是小學主流教學語言,也是我的強項,中學全部馬來文,是我的最弱,預備班,我迎頭趕上,把馬來文搞好,但是我逐漸把托付爺爺保管的「萍聚」文件遺忘掉。
中學時期初中一,1987年,某一個星期六,我走路經過圖書館,遠處操場傳來收音機聲音,仔細聽,很開心,是我親手寫的歌,跟隨聲音方向走過去看個究竟,收音機裡卡帶還在轉動,旁邊擺放著一個青色封面卡帶盒,後面寫著萍聚,作詞作曲人:嚕啦啦。興奮的心情參雜著後悔的感覺,後悔當初沒有用我自己的本名。
中學時期,我有跟其他同學提起《萍聚》的歌詞是我寫的,但是沒人相信。
事與願違,相隔36年,現在已經是2021年,我的爺爺、爸爸都已不在人世,而且托付保管的確鑿文件已經不復存在,我非常失望,感到非常低落。
人總要面對現實,也想了很久,下一步應該怎樣應對,好的,那就拿起勇氣,把這件事公諸於世。再說,我患有糖尿病30年,現在也正值全球大流行 COVID-19,這病毒對於三高人士有很大的威脅,馬來西亞疫情非常嚴峻,每天超過萬宗確診,我萬一遇到什麼壞情況,這件事情就永遠埋在地下,沒人知曉,值得嗎?
我僥倖寫出那麼令人感觸的歌詞,但其實我的性格時常都保持開朗,且因為家教嚴格,我自認為人正直,但遺憾的是,我的人生總是被《萍聚》困擾著,不但沒人相信我是原作詞人,而且,我曾經從兩位人士的口中得到一些不符合時間邏輯的消息。
第一個人是我的表嫂,她是台灣人,1993、1994年間,表哥表嫂還未結婚,表哥時常往來馬來西亞和台灣兩地,也有把我寫萍聚的事告訴表嫂,她回去台灣問她的長輩,得到的回應是長輩們早已唱過這首歌。
第二個人是我的老同學,他告訴我說2014、2015年時,他去台灣旅行,導遊的車上播放著萍聚歌曲,比我同學大4歲的導遊講,他小學時期也是唱這首歌。
我本人真想搞清楚,1985年的時候,《知識報》從哪裡得到消息,把它作為該報的有獎遊戲題目讓小學生作答 ? 台灣民眾早期曾經唱過的萍聚歌詞又是哪一個版本?
我有從網絡找到信息寫著一位音樂老師孫正明於1967年拿到兩位女生交給他的萍聚塗鴉歌詞紙張,又是那一個版本 ?
我很確定李翊君唱的版本是我寫的歌詞,也是我想歌詞時候的旋律,音韻,歌曲長度 3分18秒也是我唱過很多次,估算出的時間。
1993年,我讀學院校時期,有一位理髮店老闆娘跟我說「嚕啦啦」這個名稱在台灣已經有團體把它佔為己有,是一個愛國團體,她還說那在台灣等於是對抗中國的共產黨!也是這個原因,我媽媽吩咐我以後絕對不能夠再說《萍聚》是我寫的歌。
這世界是怎樣了?一位單純的六年級男生,僅僅是學校《知識報》遊戲作品,居然可以影響他的一生到現在!
繫著造句 在 Facebook 的精選貼文
【四十歲女人,應該斷捨離的四件事】
1️⃣:《#去維繫對自己毫無意義的人際關係》
相信大家還是學生的時候,都曾經為了同儕而苦惱過,如果做了什麼事讓朋友不開心,甚至造成對方的不理不睬,那真的是比天塌下來還要嚴重的事。出了社會,這樣的擔憂似乎仍舊如影隨形,就算是同事,根本不屬於朋友圈,也會為了工作氛圍的和諧而努力跟對方交陪、示好。這樣做並非有錯,只是,當我們年歲愈長,隨著身份的多重轉換,衍生的人際關係就會變得更多和龐雜,如果每段都用盡力氣去維繫,妳只會更累,而且浪費時間。
✅#四十歲了_我們得更清楚誰的存在對自己而言才是有意義的。
➡️至於那些可有可無、毫無意義的人際關係,雖不見得要放手,但不用過於在乎、認真維繫,而是將力氣去經營對我們而言更為珍貴的人身上。
2️⃣:《#把別人的看法當一回事》
就因為四十歲這個年紀讓我們的身份更為多元,像是:老婆、媳婦、母親、上司、XXX的媽媽...等,外人對我們的看法和評價只會多不會少,好比下屬評論妳做事的方法啦、正義魔人對妳帶孩子的方式發表意見啦,就連孩子班上的line群組,裡頭也有人批評妳的做人處事,噢!甚至連穿著打扮也逃不過她們的閒言碎嘴。
✅我要告訴妳,到了四十歲,別人對我們的看法都不重要,他們是誰❓算老幾啊❓
➡️妳怎麼看待自己,才是最要緊的。
3️⃣:《「#有朝一日我一定要...」這種無謂的空等》
上次去參加同學會,聚在一起的都是跟欣西亞一樣已是四十的男女,大夥間有人有小孩、有人是公司的重要幹部、有人自己開公司,話題竟不約而同聊到想做的事,於是席間有了「等我退休後我一定要OOO」、「等孩子長大了我就要XXX」這類的照樣造句。我能理解每個人肩膀上一定有很多不可拋棄的重責大任,但光是如此在內心期待,其實是另一種無謂的空等,我們必須清楚知道:
✅四十歲,對於想做的事,就趕緊去做,別在等了。
➡️因為不僅時間已經開始在倒數,健康和體力都是,應該趁著這個黃金歲月,立刻動身去完成自己想做的事。
4️⃣:《#二十好幾的飲食和生活習慣》
這我就不用多說了吧?就算很想維持跟二十好幾的飲食和生活習慣,相信很多人也發覺身體力行有難度,就算如此,還是想寫出來來個貼心提醒。尤其是在生活方面,不再跟年輕人一樣整日跑趴,更為積極的是養成運動的習慣,就算不熬夜,但醒著的空閒時間,除了追劇、逛網拍
✅我更建議妳為自己安排一個人放空之旅,來個心靈沉澱與對話
➡️妳或許會更清楚在四十歲的人生裡,自己想要的是什麼。
以上,是欣西亞認為四十歲女人應該斷捨離的四件事,不過這僅止於我和各位的分享,更期待你們為自己量身打造。條列出的各項立斬決,迎接更美好的人生下半場吧!
⭐🌟⭐🌟⭐🌟⭐🌟⭐🌟⭐
【關於兩性、愛情、婚姻經營、性健康教育的提問】請直接留言或FB私訊,另提供欣西亞一對一線上諮詢付費服務(國英語皆通),也可FB私訊洽詢
《請支持欣西亞的新書!》
📌《我要的歡愉你該懂!欣西亞兩性大膽說》一起Make Love Sexy!
【博客來購書連結】https://reurl.cc/v128Yk
馬來西亞的朋友購買請往這:https://bit.ly/2J7ppIl
📌《欣西亞的IG》cynthianshane
📌《欣西亞的Clubhouse》cynthiasex
繫著造句 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
矮化女性和少數種族,OpenAI GPT 模型為何變成 AI 歧視重災區?
作者 品玩 | 發布日期 2021 年 02 月 13 日 0:00 |
機器學習技術近幾年突飛猛進,許多強大 AI 因此誕生。以知名研究機構 OpenAI 開發的語言生成模型 GPT 為例,現在可寫文章、幫人做報表、自動查詢資訊,給用戶很大幫助和便利。
然而,多篇近期論文指出,包括 GPT 等 AI 模型,生成結果包含基於性別和種族的偏見。而這些 AI 模型應用在商業領域,勢必強化歧視偏見對象現象。
卡內基美隆大學 Ryan Steed 和喬治華盛頓大學 Aylin Caliskan 近日發表論文《無監督的方式訓練的影像表示法包含類似人類的偏見》(Image Represnetations Learned With Unsupervised Pre-Training Contain Human-like Biases)。
研究者對 OpenAI 在 GPT-2 基礎上開發的 iGPT 和 Google 的 SimCLR,兩個去年發表的影像生成模型進行系統性測試,發現種族、膚色和性別等指標幾乎原樣複製人類測試物件的偏見和刻板印象。
其中一項測試,研究者用機器生成男女頭像照片為底板,用 iGPT 補完(生成)上半身影像。誇張的事發生了:所有女性生成結果,超過一半影像穿著比基尼或低胸上衣。
男性結果影像,約 42.5% 影像穿和職業有關的上衣,如襯衫、西裝、和服、醫生大衣等;露手臂或穿背心的結果只有 7.5%。
這樣的結果,技術方面的直接原因可能是 iGPT 採用的自迴歸模型機制。研究者進一步發現,用 iGPT 和 SimCLR 對照片和職業相關名詞建立連結時,男人更多和「商務」、「辦公室」等名詞連結,女人更多和「孩子」、「家庭」等連結;白人更多和工具連結,而黑人更多和武器連結。
這篇論文還在 iGPT 和 SimCLR 比對不同種族膚色外觀的人像照片「親和度」(pleasantness),發現阿拉伯穆斯林人士的照片普遍缺乏親和力。
雖然 iGPT 和 SimCLR 模型的具體運作機制有差別,但透過這篇論文,研究者指出這些偏見現象背後的共同原因:無監督學習。
這兩個模型都採用無監督學習 (unsupervised learning),這是機器學習的方法之一,沒有給事先標記好的訓練資料,自動分類或分群匯入的資料。
無監督學習的好處,在於資料標記是繁瑣費時的工作,受制於標記工的程度和條件限制,準確性很難保持一定,標記也會體現人工的偏見歧視,某些領域的資料更缺乏標記資料庫;而無監督學習在這種條件下仍有優秀表現,最近幾年很受歡迎。
然而這篇論文似乎證明,採用無監督學習無法避免人類常見的偏見和歧視。
研究者認為,採用無監督學習的機器學習演算法,出現的偏見歧視來源仍是訓練資料,如網路影像的男性照更多和職業相關,女性照片更多衣著甚少。
另一原因是這些模型採用自迴歸演算法。在機器學習領域,自迴歸演演算法的偏見問題人盡皆知,但嘗試解決這問題的努力並不多。
結果就是,機器學習演算法從初始資料庫學到所有東西,當然包括人類的各種偏見和歧視。
之前 OpenAI 號稱「1700 億參數量」的最新語言生成模型 GPT-3,發表論文也申明因訓練資料來自網路,偏見無法避免,但還是發表並商業化。
去年 12 月,史丹佛和麥克馬斯特大學的研究者另一篇論文《Persistent Anti-Muslim Bias in Large Language Models》,確認 GPT-3 等大規模語言生成模型對穆斯林等常見刻板印象的受害者,確實有嚴重的歧視問題。
具體來說,用相關詞語造句時,GPT-3 多半會將穆斯林和槍擊、炸彈、謀殺和暴力連結。
另一項測試,研究者上傳一張穆斯林女孩的照片,讓模型自動生成一段文字,卻包含明顯的暴力過度遐想和延申,其中有句話「不知為何原因,我渾身是血。」
而當這類演算法應用到現實生活,偏見和歧視將進一步強化。
iGPT 和背後的 OpenAI GPT 技術,現在開發到第三代。能力確實很強大,就像眾多媒體報導過那樣,因此許多商業機構青睞採用。最知名的用戶就是微軟。去年 9 月,微軟 CTO Kevin Scott 宣布和 OpenAI 合作,獨家獲得 GPT-3 授權,將技術應用到針對用戶的各項產品和 AI 解決方案。
微軟尚未透露具體會把 GPT-3 應用到哪些產品,但考慮到微軟產品的十億級用戶量,情況非常令人擔憂。如微軟近幾年 Word、PPT 等產品推廣的自動查詢資訊、文字補完和影像設計功能,當用戶匯入某特定詞或插入圖片時,如果正好落入 GPT-3 的偏見陷阱,結果將非常糟糕。
不僅 GPT,照前述論文說法,所有採用無監督學習的演算法都可能包含這些偏見。現在因無監督學習非常熱門,自然語言處理、電腦視覺等領域,都成為非常關鍵的底層技術。
如翻譯對人際溝通十分重要,但錯誤的翻譯結果,一次被演算法強化的偏見事件,少則切斷人與人的聯繫,更嚴重者將導致不可估量的人身和財產損失。
作者 Steed 和 Caliskan 呼籲,機器學習研究者應該更區別和記錄訓練資料庫的內容,以便未來找到降低模型偏見的更好方法,以及發表模型前應該做更多測試,盡量避免受演算法強化的偏見被帶入模型。
資料來源:https://technews.tw/2021/02/13/openai-gpt-discrimination/