TaiGen 台灣文化主體性生成式人工智慧引擎(簡稱 台擎)(Taiwan Subjective Generative AI engine) 就是使用 ARCL自主遞迴學習 跟 TaiWiki 台灣主體維基百科(簡稱台灣百科 Taiwan Subjective Wikipedia / TaiWiki ) 遞迴生成!成立群募,招募堅定台派志願者共同投入!
要把過去台灣國家計畫的 數位典藏 跟 數位學習 以及 開放資料 等 語料 用人工智慧 整合到 台灣主體維基百科,來訓練台灣人工智慧引擎,但是 先建立 【TaiYuYi 台灣語義空間(Taiwan YuYi space ) 】這是透過 【台灣有義s】人工智慧,整理出 300維語義向量空間,透過26個【語義冠碼 YuYi prefix 】建立 獨一無二的 【語義代碼】以台灣文化主體性立場,建立的【語義向量空間】(也就是 Taiwan Authority Data 台灣權威資料 ) 就是運用 CNS國家標準 的 時地人物事 權威語意,這是與國際接軌的台灣文化主體性,例如 a_ 政治實體 administration 的定義,雖然接軌 ISO 3166 的國際標準,但是 台灣的國家標準是 CNS12842 確認譯名譯音都是採用 台灣文化主體性,與中國不同 ,再 基於 台灣文化主體性 修正,a_TW 代表 台灣(中華民國) Taiwan( R.O.C. ) 或 中華民國(台灣) 而非 原本 ISO 3166的定義。
基於 【TaiYuYi 台灣語義空間】將過去台灣國家計畫的 數位典藏 跟 數位學習 以及 開放資料 等 語料 用人工智慧 整合到 台灣主體維基百科,來訓練台灣人工智慧引擎,這就是要運用 TaiGen Encoder 台擎編碼器( 台灣文化主性生成式人工智慧引擎編碼器) 將 這些 【TaiCorpus 台灣文化主體性語料(Taiwan Subjective Corpus) 】整合出來 ,再透過 志工群跟【TaiValuer 台擎價值引擎】合作,已 RLHFAI 人工智慧及人類反饋強化學習 校正整個語料的 價值體系,符合 台灣文化主體性。
然後以【台灣文化主體論述】為起點,將 【TaiCorpus 台灣文化主體性語料】在 【TaiYuYi 台灣語義空間】的架構上,使用 TaiGen Decoder 台擎解碼器( 台灣文化主性生成式人工智慧引擎解碼器) 自主生成 第1代 【TaiWiki 台灣主體維基百科】,目前繁體中文維基百科有大約一百五十萬個詞條,待建詞條也大約一百萬詞條,所以運用 【TaiGen Decoder 台擎解碼器】自動將【TaiCorpus 台灣文化主體性語料】生成超過 250萬條詞條的第1代【TaiWiki 台灣主體維基百科】,這是在 【台灣文化主體性管理團隊】 自行管理,避免中國管理者的干擾,保證 其台灣文化主體性,這是關鍵,所以初期只對 觀禮團隊開放,進行運用跟修正,主要是利用 第0代 【TaiGen 台擎】人工智慧 (包含 編碼器 跟 解碼器 跟 【TaiValuer 台擎價值引擎】跟 【台灣文化主體性管理團隊】(用 全文檢索等工具進行校對檢查) 互動,這樣藉以建立 第1代 【TaiCorpus 台灣文化主體性語料】跟 第1代【TaiWiki 台灣主體維基百科】,然後 進行 預訓練,產生 第1代 【TaiGen 台擎】人工智慧引擎,這是真正純粹的 TaiGen 台灣文化主性生成式人工智慧引擎 ,然後再利用 第1代 【TaiGen 台擎】生成 第2代 【TaiCorpus 台灣文化主體性語料】跟 第2代【TaiWiki 台灣主體維基百科】,透過這樣的 自主遞迴學習ARCL (Autonomous ReCursive Learning) !就是 人工智慧 自己 遞迴微調自己 或 遞迴不斷訓練新一代的 人工智慧!這樣在幾代之後,【TaiCorpus 台灣文化主體性語料】跟 【TaiWiki 台灣主體維基百科】就能追上國際大型人工智慧 LLM 大語言模型 的 訓練語料規模,而 藉由 孤立語態的特性(語意密度最高),以及 一開始就是用 【TaiYuYi 台灣語義空間】的嚴謹特性,在相同規模下,都可以獲得更佳的表現,尤其在面對台灣繁體中文語料被打壓,台語客語原住民語料被大型語言模型收入幾乎為零的窘境,所以針對台灣本地的人工智慧運用情境,絕對可以產生勝過國際大型語言模型的成效,尤其能夠確保【台灣文化主體性】(當然也包含台灣政治主體性的正確價值觀),這樣才能將副本,開放給台灣國民使用!而這個【TaiWiki 台灣主體維基百科】也將成為 台派網路使用者的核心社群,當然無法百分之百防止滲透,但是至少由於是台派管理,至少能夠確保台派資訊發表的公正性與可靠性,這就是一個新的社群,藉由【TaiWiki 台灣主體維基百科】的焦點使用者社群(台派KOL)都能保障其發表內容,也讓他們很容易將內容發表成為 【TaiCorpus 台灣文化主體性語料】的一部分,可以同步修訂【TaiWiki 台灣主體維基百科】,這樣經過台派使用者的參與,在第5代或第6代之後,就已經可以成熟到提供給台灣所有企業跟公務機關使用!
[李東昇的說明]台灣有興趣有意願夥伴保持聯繫,近日就會公布群募與核心管理群的募集計畫。