跳至主要内容

博文

OpenAI 开源的Whisper体验

近期有一个需求,类似于数字人,用户用语音控制进行菜单跳转,甚至于进行分析。 当用户对着麦克风进行说话的时候,要解析出来用户想干什么。当然好多付费的接口可以实现,但基于互联网免费的思路,当然要查找一翻。 Whisper 是用于自动语音识别 (ASR) 和语音翻译的预训练模型。 Whisper 模型经过 68 万小时的标记数据训练,表现出强大的泛化能力,无需进行微调即可推广到许多数据集和领域。 写的很强大,HuggingFace上有搭建好的模型当然要试用一下了,效果还不错,中文的解析正确率也挺高的,下面是接口请求方式。
最新博文

Wireguard 部署应用

 一、首先要有一个公网IP来进行服务端安装配置,为了简化部署,并且尽量少的侵入性,就用Docker安装服务端: services:   wireguard:     restart: always     image: weejewel/wg-easy     container_name: wireguard     ports:       - "51820:51820/udp"       - "51821:51821/tcp"     environment:       - TZ=Asia/Shanghai       - WG_HOST=0.0.0.0       - PASSWORD=123456       - WG_PERSISTENT_KEEPALIVE=25       - WG_DEFAULT_ADDRESS=10.0.8.x       - WG_DEFAULT_DNS=114.114.114.114       - WG_ALLOWED_IPS=10.0.8.0/24     volumes:       - ./wg-easy:/etc/wireguard     cap_add:       - NET_ADMIN       - SYS_MODULE     sysctls:       - net.ipv4.ip_forward=1       - net.ipv4.conf.all.src_valid_mark=1 二、客户端安装: # root权限 sudo -i # 安装wireguard软件 apt install wireguard resolvconf -y # 开启IP转发 echo "net.ipv4.ip_forward = 1" >> /etc/sysctl.conf sysctl -p wg-quick up wg0

Suno 音乐界的ChatGPT时刻,终于到来了!

          打开suno的网址,首先进入眼帘的是爱好者们用suno生成的歌曲列表,可以点击播放键,在线欣赏。          如果你也想制作自己的歌曲,那就需要先登录一下,Suno支持Discord、Google、Microsoft快捷登录。           点击左侧的Create,在Song Description里填写上歌词,就可以生成歌曲了           想看自己生成的歌曲,可以点击左侧的Library,里面就是自己生成的歌曲

Trancy 沉浸式翻译,浏览器插件

          最近的学习中,需要观看Youtube上的视频,奈何英文比较差,对于英文的视频很难看懂其中的介绍,发现了一个非常好用的插件 Trancy。           一个专为语言学习者设计的全能工具,除了支持YouTube/Netflix双语字幕,Trancy还提供了网页AI划词翻译和全文翻译等功能,你可以巧妙地将内容转化为自己的语言学习资料。借助Trancy,你可以体验高效且有趣的沉浸式语言学习。

Docker-Compose 安装 PolarDB

 version: '3.1' services:   polardb:     container_name: polardb     restart: always     image: polardb/polardb_pg_local_instance     ports:       - 5432:5432     networks:       - net_db     environment:       TZ: Asia/Shanghai     volumes:       - ./polardb:/var/polardb networks:   net_db:     external: true

10年工作经验与1年工作经验用10年?

  一、前言 先听一个故事: 程序员明明:“大师为作为一个具有 3 年工作经验的人,为啥别人 2 年工作经验比我还强呢?” 大师回答道:“你只是工作了三年,未必有三年的经验。” 程序员明明:“大师此话怎讲?” 大师回答道:“说来话长....,你还是直接去看悟鸣同学的文章吧.....” 不知道大家想过没有,同样是在软件开发行业工作 3 年,为什么有些人经验丰富,可以独当一面,而有些人却还和工作一年的人差不多?为什么一起参加工作的人,同一批人中很多人都升到了团队主管的职位,而还有很多人还是普通的开发? 如果你对此话题感兴趣,并且想了解如何更快速成长,且听我慢慢道来。 二、为什么? 2.1 客观原因:工作简单、枯燥、重复 很多人成长缓慢的一个重要原因是:总是干一些相对简单、枯燥而且重复的工作。 曾经当面试官的时候我就面试过一些外包同学,简历上的很多项目问项目的价值就是“别人就这么安排的”,问技术都是“调调别人封装好的接口”,没有自己的思考和技术沉淀。也有一些国企工作想来互联网公司发展的程序员,工作四五年了技术栈比较陈旧,还是 SSH 那一套,连分布式缓存、分布式消息队列等都没用过、问其原理也不太清楚。结果就不用多说了。 2.2 主观原因:不愿出舒适区 俗话说,“只要思想不滑坡,办法总比困难多”。 虽然各种客观条件能够限制一个人的发展,但是本质上限制人的是主观原因,其中一个非常重要原因是很多人不愿意走出舒适区。 舒适区、学习区和恐慌区是美国心理学家Noel Tichy提出的理论,用于描述人类对外部世界的认识和处理方式。所谓舒适区,是指我们熟悉、能够轻松应对的领域或任务,不需要太多的学习和思考,通常会带来舒适感和满足感。在舒适区,我们不需要付出太多的努力,也不需要冒太大的风险,因为我们已经掌握了相关的知识和技能,能够应对各种情况。所谓学习区,是指我们不太熟悉、需要学习和探索的领域或任务,需要花费较多的时间和精力去掌握相关的知识和技能。在学习区,我们需要不断地学习和实践,才能够取得进步和提高。学习区通常会带来一定程度的挑战和不适感,但也会带来成就感和满足感。所谓恐慌区,是指我们完全不熟悉、无法应对的领域或任务,需要付出极大的努力和冒极大的风险才能够应对。在恐慌区,我们会感到极度的不安和恐惧,因为我们不知道该如何应对和解决问题。恐慌区通常会带来极大的压力和焦虑感,可能会导致我们出

Docker-Compose 安装 Portainer

 version: '3.1' services: portainer: image: portainer/portainer-ce:latest container_name: portainer hostname: portainer restart: always volumes: - "/var/run/docker.sock:/var/run/docker.sock" - "./portainer_data:/data" - "./portainer_cn:/public" environment: TZ: Asia/Shanghai LANG: en_US.UTF-8 ports: - "9001:9000" networks:      - net_db networks: net_db: external: true