学习开源仓库chatgpt-on-wechat

看下别人的技术栈

Posted by tokenian on April 18, 2024

通过学习开源仓库,了解当下的技术栈,潮流趋势。文章只是作为个人的学习笔记,所以不具备很好的可读性。旨在将来哪天个人查阅 https://github.com/zhayujie/chatgpt-on-wechat 这个项目有点标题党的感觉,star还不少。大体的思路是,用户和聊天机器人发送文字或者语音的对话,机器人后台调用AI接口获取响应。项目提供了开箱即用的能力,对拿来主义者很方便

支持的AI接口囊括了市面上主流的服务,阿里、Claude、Gemini、LinkAI、讯飞、智谱、OpenAI、百度

聊天的微信、钉钉、飞书、WeWork、黑屏终端

语音有tts和asr,前者是Text To Speech的意思,意为把文本转换成语音,后者相反。有一些库是免费的,比如edge_tts,pytts,elevenlabs。大厂的百度、阿里、谷歌、亚马逊、OpenAI、LinkAI。

一点思考

钉钉和飞书支持创建应用机器人,机器人可以接收用户发送过来的消息,从而完成自动回复功能。但是微信无论个人还是企业版,目前开放的仅有推送消息的能力,以微信的用户量,为何不放开这个能力?微信不放开,市场上自然就有黑科技来完成这个功能,比如wechaty。对于用户数量多的应用,某些能力没有,市场自然会滋生辅助工具来完成。比如微信不支持陌生人聊天。

不懂微信的战略布局,也许以后会放开吧。目前微信的客服能力我感觉有鸡点肋。

LinkAI是家什么公司?语音、聊天都有接口。

支持插件

一个基本的消息处理流程是

1
    1.收到消息 ---> 2.产生回复 ---> 3.包装回复 ---> 4.发送回复

前面三个过程可以基于事件机制作广播,插件注册感兴趣的事件作监听,编写装饰器代码。从而控制流程的进行。

这个套路在大多是的框架很普遍。项目用python的装饰器写起来很简单。

蹭流量

国人写的项目蹭流量为假,商业变现为真。风格没怎么变,不像国外的项目那么纯粹,比较功利。套壳是种技术,套的是否优雅,是否难以模仿是个关键点。