用AI寫了個Epub生成器

in HIVE CN 中文社区7 hours ago

我近幾個月開始都有看雜誌《國家人文歷史》,更是郵購實體本,不過實體雜誌始終不夠方便,我是不會帶出街看的,但有時候在外例如上班沒事做的時候,其實是可以看的,所以後來我發現原來它有個叫果粒歷史的微信小程式可以訂閱電子版,我就立即訂閱了。

但訂閱後又發現另一個問題,就是用微信小程式看文章太不方便,一來載入速度較慢,二來不能紀錄閱讀進度,三來它一篇文章很長,可以看15-30分鐘的,有時候不能一次看完,下次再進入時又要找回上次讀到哪裡,太麻煩了,於是,我就萌生了把它製作成epub的念頭。

epub是電子書的格式,可以放到微信讀書、Kindle之類的app閱讀,可以直接跳到上次閱讀位置,又可以劃線寫筆記,十分方便。要製作epub,當然要有文字及圖片,但這個小程式禁止了選取文字。起初我是打算截圖再辦認文字的,但我試過一篇文章,一共截了27張圖,這實在是太花時間,而這篇文章一共有12張圖片,我又要逐張下載再改檔案名字,再修改整理OCR後的文字,太太太麻煩,於是,我便決定找AI幫忙,這次找的是Gemini。

Gemini先教我抓包,下載一個叫Proxyman的程式,然後在電腦上打開微信小程式,Proxyman就能把文章抓包下來了,我把抓包後的Json給Gemini分析,它就幫我寫了一個Python將Json轉換成方便製作epub的html格式。之後我不斷提出新的要求改良,例如把圖片也下載,自動改名,避開微信封鎖,設計好UI,最後索性叫Gemini把整理好的html檔及圖檔打包成epub給我,花了兩個小時不斷修改,終於製成了這個小程式。

現在我手動要做的,就只有打開微信小程式,逐篇文章打開,然後去proxyman複製抓包下來的文章json,其他的就全包給這個小程式,一本17篇文章的雜誌,我不用10分鐘就成功製作成epub了。其實我想把抓包的動作也寫程式的,但Gemini說微信的反爬蟲機制很變態,很容易被封,所以都是建議我手動抓包。

不過這樣我已經很滿意了,本來以為要自己截數百張圖,辦識文字再自己整理成文章,還要自己下載圖片,改檔名,整個過程做一本雜誌肯定要數個小時,但現在10分鐘就可完成。

AI是很強勁的工具,我們真的需要學習利用AI,不是學習使用AI,因為AI是不需要學習如何使用的。在未來,我們不會被AI淘汰,我們只會比更懂得利用AI的人淘汰。