日本长崎:世界最大烟花绽放夜空
世界上最大的烟花在日本长崎上空升空
世界上最大的烟花在日本长崎上空升空
该开源项目提供PDF双语翻译功能,Star数量在一个月内增长近9000。它能良好处理图片和公式排版,支持Google、DeepL、Ollama、OpenAI等翻译服务,并支持CLI、GUI和Docker部署。项目链接: https://t.co/Sitzug7oqe https://t.co/wceXNmSXb1
AI已有效解决了家长辅导孩子作业的难题。使用Gemini批改孩子6页试卷仅需2分钟,避免了辅导作业过程中的冲突,让亲子关系更加和谐。
一位母亲让孩子完成一套数学试卷后,让父亲批改。试卷无答案,共有6页。父亲尝试了两种方案:一是使用ChatGPT的视频模式,通过摄像头与AI实时批改;二是拍照上传给Gemini或ChatGPT逐页批改,最终选择了后者。
使用Gemini 2.0体验版,系统成功批改了95%的题目,包括图形题、竖式计算等多种题型。对于AI批改错误的题目,家长只需人工复查即可。这大大节省了家长的时间,无需重新完成试卷。
这表明,2024年LLM的多模态功能已取得显著进步,能够处理现实世界中较为复杂的任务。LLM的图像识别能力已相当成熟,建议大家尝试使用其多模态功能。
国内使用先进模型面临诸多挑战,部分原因在于海外因素及企业对AI API的监管及二次开发需求。302.AI平台服务B端和C端客户,整合了众多市面上主流的前沿模型。
电子书朗读工具:一键生成AI有声书
该开源工具支持1100多种语言,并可克隆个人声音,将电子书一键转换为带章节的有声书。其核心功能包括:AI语音合成(XTTSv2和Fairseq)、支持超过1100种语言、可克隆用户声音、提供Gradio网页界面和命令行模式,以及Docker容器化部署,方便用户在Hugging Face Space和Google Colab上快速部署。
DeepSeek v3 in 3-bit runs pretty fast (~17 toks/sec) on 2 M2 Ultras with mlx-lm and mlx.core.distributed.
Model is 671B params (!) with 37B active: https://t.co/FOpuQFe0E0 [原文]
Mobbin是一个界面设计参考网站,提供大量英文App截图,并支持按界面元素(例如表格)筛选。与Dribbble和Behance相比,我更常用Mobbin。推荐使用。 https://t.co/tfEGe9LxLq
太酷了⚡️ 这个 LLM 3D 可视化工具彻底让我了解了大语言模型背后的运行原理
在 V2EX 看到一个有趣的帖子「我是如何从零开始手搓一个独立游戏并上架 Steam 的」,过程很长,作者很有执行力,甚至是业余时间“加班”做的一个中国加班的游戏,里面有不少过程值得学习。
Chrome扩展程序开发近年成为独立开发者新兴赛道,其优势在于开发简单、上线快速、SEO友好、一次开发多平台发布及高灵活度。开发者可通过开发微信、支付宝或Stripe支付,或使用第三方平台Kodepay( https://t.co/T7ibgyx1Ra)实现插件收费。作者分享了其成功案例:通过开发SCRM插件,一年内获得5万+周活跃用户和40万的年收入。学习资源包括官方文档( https://t.co/U70hopAIzs)、中文教程( https://t.co/0fshpIVbHU)和GitHub项目。作者强调了“插件精选”的重要性,获得精选的方法包括持续遵守规则并保持高用户评价,或主动申请(需准备插件ID、联系邮箱、网站域名、产品展示资料等)。
2025年独立开发者技术栈:
Next.js (开发框架),Vercel (部署),Supabase (后端/鉴权/存储),Resend (邮件服务),Languine AI (AI翻译),Expo (移动应用开发),novu (通知服务),Polar (支付),Triggerdot (后台服务),OpenPanel (分析服务),以及一个未指定的E2E测试工具(链接已提供)。
LlamaCoder 现在有了“高质量”模式,性能大幅提升!它使用两次链式大型语言模型调用(第一次调用制定计划,第二次调用编写代码)来创建更好的应用程序。
80年代末,歌手娃娃(金智娟)在香港结识一位大陆诗人,两人相恋。90年,娃娃赴北京探望男友,后得知男友已婚,伤心分手。91年,娃娃向李宗盛倾诉这段经历,李宗盛以此为灵感创作了《飘洋过海来看你》。歌曲创作取材于娃娃的北京之行,她耗尽半年积蓄,为这次会面反复练习言谈举止,但对北京的印象仅限于与男友相处的日子和漫天风沙。娃娃在歌曲录制过程中数度落泪。据悉,该诗人名为鲁福荣,后因犯罪被判死刑。
Napkin 是一款制作精美的图表工具,只需一步复制粘贴即可完成。将文本粘贴到Napkin中,即可选择十几种视觉呈现方式,并自由调整颜色、图表和装饰细节。最后下载图表插入文章即可。该工具操作简单,能有效提升生产力。
代码、写作、销售是2025年积累第一桶金最重要的三个技能。
代码:无需刷LeetCode,需能与AI梳理需求和产品架构,借助Cursor快速迭代,用ChatGPT理解技术文档和调试程序。具备审美能力更佳。
写作:无需华丽辞藻,甚至允许错别字。需简洁表达深度思考,与读者产生共鸣,并持续创作和分发。具备网感可加速正反馈。
销售:无需口若悬河,清晰表达即可。需洞察客户需求,了解客户决策过程和预算审批流程,勇于尝试不同话术和讲故事。熟悉垂直领域专业知识并拥有丰富经验,可成为咨询型销售,从而快速突破。
因此,2025年,持续进行代码编写、写作和销售。
人类认知偏差主要体现在四个方面:信息过载、缺乏意义、需要快速行动和记忆的局限性。
信息过载导致我们优先注意特定信息,出现确认偏差、改变敏感性、关注他人缺陷和寻找模式等偏差。缺乏意义则让我们填补信息空白,依赖熟悉感和偏爱,简化概率,并假设他人想法。需要快速行动促使我们简化选择、避免错误、坚持完成任务、关注眼前事物并追求行动信心。最后,记忆的局限性导致记忆扭曲、抽象化和简化关键点。
百度公司曾拥有诸多发展机遇,却未能抓住。从搜索引擎到移动互联网、人工智能等领域,百度均未能取得预期的成功。其贴吧、91助手、百度云等产品也未能长期保持竞争力。在智能驾驶领域,百度的投入巨大,却在商业化方面落后于竞争对手。 人工智能方面,尽管曾吸引到吴恩达等人才,但百度最终未能保持领先地位,在AIPC合作中也未能持续与苹果保持合作。
百度的问题在于其内部的“诸侯制”销售体系和依赖灰色产业的竞价收入模式。这种结构导致地方势力强大,总部难以有效管理,并滋生了腐败。这种价值观偏差也影响了产品研发和管理,导致产品质量差强人意。 作者认为百度的困境源于其内部结构性问题和价值观偏差,建议李彦宏另起炉灶。
obsidian + copilot 插件,填了 deepseek 作为聊天模型,填写了硅基流动上的 bgm-m3 作为嵌入模型。现在打开任意一篇文章右侧会展示强关联的文章,这种漫步浏览的感觉太好了,不用手动整理了,还是要多写文字、多剪辑视频,保存当下的感受,很开心 https://t.co/xJGUnejk0b [原文]
RPA工具Automa能显著提升效率。它支持小红书、飞书、抖音、TikTok等多个平台,并可结合AI处理数据和素材,最终获得理想结果。Automa基于浏览器插件,操作简便,如同搭积木,可用于数据抓取、表单填写、邮件发送等多种场景。[链接]
寻找小程序或APP创意的方法:在小红书搜索“小程序”、“APP”,关注用户需求讨论帖,例如“需求很大却没有人做的小程序”等,查看评论区,寻找与金钱、健康、社交关系相关的创意点子。 可以使用RPA工具辅助收集信息,并利用AI进行聚类分析。 筛选出有价值的创意后,可以建立讨论组,与用户深入交流,了解其真实需求,从而构建更符合市场需求的小程序或APP。