【文/馮震宇 圖片提供/達志影像】
在全球正面臨數十年最嚴重通貨膨脹威脅之際,卻出現了人類歷史上影響深遠的變化,那就是生成式人工智慧(Generative AI)的大爆發,它不但讓2023年成為生成式AI元年,也讓2023年成為AI訴訟元年。
在ChatGPT、DALL.E、Midjourney、Stable Diffusion、Copilot等的領軍之下,生成式AI一舉突破過去數十年人工智慧發展的瓶頸,讓使用者不必學習程式語言,就可以用自然語言與AI互動。其互動的結果,不僅能讓使用者立即獲得回覆,還能快速生成令人目不暇接的各種圖片、影片、音樂、文本、程式碼、甚至書籍等內容。也因為如此,ChatGPT在推出第一周就達到百萬用戶,兩個月的註冊用戶就達到1億人,成為歷史上增長最快的消費應用軟體,也讓推出ChatGPT的開發商OpenAI的估值達到創紀錄的290億美元,成為價值最高的獨角獸。在此熱潮下,只要與生成式AI有關的各國股票都紛紛大漲,不但讓生成式AI成為資本市場的熱點,也打趴元宇宙、NFT與區塊鏈,未來像電影《鋼鐵人》那樣,以說話方式和AI互動的場景,也將不再是遙不可及了。
然而在擁抱AI之前,還得要先跨越一道法律的門檻,那就是AI創作所引發的法律保護與責任之爭。生成式AI與過往AI技術不同之處,在於其運用大規模的語言模型(LLM),從網路上或其他大型資料庫取得海量資料進行訓練,並讓使用者得以用自然語言和AI互動,AI則根據使用者所提出的問題或指令,自動加以回答或生成各式各樣的內容。
但是對生成式AI所自動產生的內容是否會有著作權問題呢?我們可以隨意使用嗎?誰又能取得權利或是應負侵權之責呢?若真有侵權疑慮,能否主張合理使用來免除責任呢?因為這些問題,目前已經出現多件訴訟案件,將生成式AI所衍生的法律疑義推上風口浪尖,也凸顯目前整體智慧財產權法制(特別是著作權法)的不足。
AI突破性發展
挑戰傳統創作模式
AI的發展可追溯到1950年。當時號稱計算機科學與人工智慧之父愛倫圖靈(A. M. Turing)在期刊上發表了一篇劃時代的論文(Computing Machinery and Intelligence),並提出了「機器可以思考嗎」(Can Machines Think)這個重要的問題,為AI研究揭開了序幕。
爾後,AI發展日新月異,聊天機器人應運而生,機器學習技術讓機器去自己學習並尋求答案,讓AI出現實質性的突破。Google在2017年提出文字處理新理論架構(也就是轉化器Transformer)與突破,讓機器可同時學習大量的文字,大幅提高學習效率,也成為後來自然語言學習模型的基礎。例如Google在2018年的Google I/O 開發大會,就展示可自行打電話到餐廳訂位的 AI 語音系統;而開發出 ChatGPT的OpenAI也是基於Transformer模型並加以改良,並在2018年發表生成式預訓練轉化器(Generative Pre-trained Transformer, GPT)通用語言模型。
和過去任務導向型模型(如AlphaGo專注於下棋,或專注於語音識別、人臉辨識等AI)最大的不同在於,GPT模型在訓練AI時,不需要人工標註,也不需要為AI準備相關的資料,而是讓AI擷取人類所生成的現有資料去進行強化訓練並產生內容,因此可以節省大量的成本,並加速AI的學習。而ChatGPT正是一種基於GPT-3所開發出來的聊天機器人,其中最神奇之處,在於不用教使用者如何學程式語言去讓電腦執行,而是讓人能用自然語言與電腦溝通互動,這種即時互動的特性,讓ChatGPT一炮而紅,將AI帶入一個新的境界。
這波生成式AI風潮除了ChatGPT外,尚有自動圖形生成的DALL.E、自動程式生成工具OpenAICodex,而生成式圖形AI像是Imagen、Midjourney、Stable Diffusion等;在影片自動生成AI方面,則有Meta的Make-A-Video以及Phenaki;在文字轉圖形轉音樂方面則有MusicM與基於Stable Diffusion的Rifussion等。在此快速發展趨勢下,生成式AI將會對人類產生顛覆性的影響。而發展更快的是,許多人運用生成式AI快速且大量的進行創作。根據媒體的報導,南韓的Snowfox Books出版社在2023年2月推出一本完全由AI撰寫、翻譯、編輯校對與封面設計的書籍《尋找人生目標的45種方法》。另根據《路透社》報導,截至2023年2月中旬,亞馬遜Kindle商店中已有200多本電子書將ChatGPT列為作者或合著者;而知名的Shutterstock、AdobeStock等圖片網站也允許販售AI生成圖片。此外網路媒體BuzzFeed則更進一步,裁掉12%的員工,並啟用ChatGPT來負責互動欄目Quizzes以生成個性化的內容,反而讓股價在5天內大漲250%。
AI生成內容是否受著作權保護?
AI各式各樣的應用與發展,除了引發AI是否會取代人類的疑慮外,更引發由AI所生成之內容是否能受到保護?若能受保護由誰取得權利?他人得否任意加以使用?甚至若有侵權問題由誰負責等問題。
根據目前世界各國的《著作權法》規定,能夠獲得保護的創作,除了要具備原創性(Originality)與表達(Expression)等基本要件之外,還必須是由「人類」(Human)所創作,才能成為著作人(Author)。由於AI並不是人,因此若現行法制沒有修改,AI的作品並無法受到保護。由於無法受到保護,理論上就屬於公共領域內的作品,可以由公眾加以利用。
為此,美國Thaler教授嘗試突破法規的限制,在2018年就以自己開發的AI系統DABUS創作出《最近進入天堂》(A Recent Entrance to Paradise),並向美國著作權局提出著作權登記,卻遭拒絕;為此Thaler對著作權局決定提起上訴,但仍在2023年2月被駁回。同樣的,美國著作權局在2023年2月也撤銷了藝術家Kashtanova用Midjourney創作的漫畫《Zarya of the Dawn》的著作權登記。
就我國而言,《著作權法》第1條明文規定:「為保障『著作人』著作權益,調和社會公共利益,促進國家文化發展,特制定本法。本法未規定者,適用其他法律之規定。」《著作權法》第3條則定義著作人為「創作著作之人」,很清楚著作權法所保護的對象是「人」。雖然我國法所稱的人包括自然人與法人,但AI兩者都不是,因此純AI作品也將很難根據現行法在我國受到保護。
值得思考的是,目前生成式AI所生成的作品仍須由人下達指令由電腦完成,而要完成一件滿意的作品可能需要輸入大量的指令或加以不斷的修改,這些指令與修改往往需要有一定經驗與能力的人才能完成,因此就指令本身與經人類修改完成的作品而言,仍有可能符合《著作權法》的保護要件而受到保護。
訴訟爭議頻傳
誰該為侵權負責?
隨著生成式AI的快速突破,不但引發其生成內容能否受著作權保護的法律爭議,更引發法律風險的問題。例如Google就推遲其音樂生成機器人MusicM模型的推出,因為Google發現MusicM所輸出的音樂作品中會有1%的內容重製其訓練資料。
2023年更被外媒喻為AI訴訟元年。多名程式設計師在2022年底向法院提起集體訴訟,指控微軟旗下的GitHub平台運用OpenAI Codex所開發AI編碼工具Copilot侵害程式人員的著作權。其主張Copilot未經同意就從網路上大型公共資料庫取用大量受著作權保護的程式碼來訓練AI系統自動生成程式碼,且未標明來源出處,構成著作權的侵害,並請求90億美元的損害賠償,也讓Copilot成為全球首宗AI侵權的訴訟案。
繼Copilot被告後,廣泛為AI藝術工作者所運用的圖形生成AI系統的開發公司Midjourney與Stability AI(開發Stable Diffusion)和大型圖庫DeviantArt也被3位藝術家控告。這些藝術家指控這三家公司所開發的AI系統未經同意,即透過網路抓取數以億計的圖像進行AI訓練,並藉此進行二次創作生成衍生作品,因而侵犯了他們以及其他廣大藝術家的權利。
這些接二連三侵權案件的出現,或許只是冰山的一角,未來隨著生成式AI的日趨普及,類似的案件將只會更多。這也不可避免的產生另一個重要的法律問題,那就是誰應該就可能的侵權責任負責?是開發AI系統的業者如OpenAI、Midjourney或Stability AI等公司嗎?還是蒐集網路上資料建構資料庫並以授權方式提供給AI業者的大型資料庫如Reddit、DeviantArt、LAION(Large-scale Artificial Intelligence Open Network)?或是訓練這些AI的訓練人員(因為他們在訓練過程中會接觸有著作權之圖片或文字等)?還是使用者?
法規未明
業者以契約避爭議
對於侵權訴訟,被控的業者除了主張原告沒有明確證明其作品被侵害的事實外,也都主張「合理使用」(Fair Use)作為抗辯。最主要的原因,就是各國著作權法為了促進社會與文化的進步,都採行了合理使用的例外,也就是在符合一定條件下(如我國《著作權法》第65條合理使用、不構成著作財產權之侵害的四個要件),就可以阻卻違法,而不必負侵權之責。
最佳的例證,就是在兩件涉及數位資訊的案件中,法院最終都以合理使用的理由判決Google勝訴。第一件就是Google為建構其Google Books Project,在未經作者同意之下,直接與各大圖書館合作,將其館藏書籍掃描為電子檔。最終法院雖認為Google未經作者同意就將書籍全文掃描以利搜尋,但由於僅讓使用者看到關鍵字所在的極小部分,故不是單純重製,而是具有「高度轉換性」(Highly Transformative)之使用,符合美國《著作權法》合理使用的規定。而另一起Oracle對上Google的訴訟案件中,Oracle指控Google抄襲其Java SE軟體中37個使用者介面(API)共計11,500行的Declaring Code原始碼,構成著作權侵害。美國最高法院最終判決認定Google的重製僅限於使用者介面之必要範圍內,其目的在於便利Java程式設計師能在具轉化性的Android平台上投注其經驗和才能,因此判決該重製行為構成合理使用。
而對於生成式AI所產生的各式各樣內容而言,由於其訓練資料庫是具有數百億甚至數千億參數的大型資料庫,再加上這些AI系統並不會直接重製,而是先將資料解析為抽象的參數,再根據AI算法與數學模型加以利用,較有可能屬於合理使用所要求的轉化性使用。
不過,究竟原始著作需要轉化到何種程度方屬合理使用仍困擾各方,而美國聯邦最高法院在2022年底就已經開庭審理的Andy Warhol Foundation與 Goldsmith訴訟案或許將可提供更明確的判斷標準,值得特別注意。
即使爭議頻傳,美國政府目前尚未推動相關法規的修改,除一些徵求意見外,僅發佈1份具約束力的《人工智慧權利法案藍圖》白皮書,表示「支持在自動化系統的構建、部署和治理中,保護公民權利和促進民主的政策和實踐能展」。相對於美國,歐洲國家則較為積極,歐盟已經訂定《數位單一市場指令》,也正在討論是否擬議《人工智慧法案》;此外,歐盟與英國還准許資料探勘(Text and Data Mining, TDM)做為著作權的例外。
在法規渾沌不明的情況下,為了避免可能的法律爭議,業者紛紛轉向契約模式,希望用契約來規避可能的法律責任。例如Stability AI就宣佈將增加選擇退出(Opt Out)條款,讓藝術家將其作品排除在其資料庫之外。
ChatGPT也特別在其2023年3月1日公佈的使用條款(Terms of Use)更新版中,以契約的方式對權利歸屬與可能的責任加以規定。
根據該條款第3點,開發商OpenAI明確表示使用者擁有所有輸入指令的權利,在使用者遵循該條款的前提下,將因使用者輸入所產生輸出本身與相關的所有權利、主張與利益(All its right, title and interest)都移轉(Assign)給使用者。OpenAI之所以如此的大方,是因為OpenAI在條款中埋下法律責任的伏筆,也就是使用者必須要對其輸入與輸出的內容完全負責,包括應確保該等內容不會違反任何法律和本條款任何內容,而且OpenAI還保留在必要情況下(如提供或維持服務、遵循法律或執行其政策等)使用該等內容的權利。
人類對於大型數位平台如Google、FB、LINE,甚至最新的ChatGPT的依賴日益加深,這些大型數位平台和他們資料庫所採用的的演算法也將會影響人類,而ChatGPT的橫空出世只是將這種現象進一步凸顯出來,透過強大的演算法、算力與大量數據,人類離未來具有感知與理解能力的AI又將更進了一步,但也對傳統的著作權法制構成挑戰。而這些平台廣泛運用契約方式限制自己的責任,也可能變動著作權法所巧妙維持的平衡。
回顧《著作權法》發展歷史觀察,可以發現《著作權法》其實就是因應技術發展(活字版印刷)而生、且伴隨技術進展而發展的一部法律,已歷經19世紀攝影技術、20世紀錄放影機、以及21世紀的數位技術(例如P2P、雲端儲存等)等諸多挑戰而不墜。雖然目前的著作權法制還無法有效因應AI的挑戰,讓平台可透過契約掌握優勢,但是就過往經驗觀察,《著作權法》也勢必會將AI技術納入著作權的範疇,並成為著作權持續發展的動力。(本文作者為政治大學法學院暨商學院合聘教授)
【本文出自《能力雜誌》2023年4月號;訂能力電子雜誌;非經同意不得轉載、刊登】