分类
- 所有帖子 550
- 实用开源项目 478
- 教程文章 22
- 在线工具 13
- AI 新闻 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- 提示模板 5
- Hugging Face Spaces 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- AI Image Generate Maker 1
- 我的收藏 0
标记为的帖子: Open Source
Content related to Open Source
Crawlee-Python:您的终极网络爬取利器
探索 Crawlee-Python,一个强大而可靠的网络爬虫和浏览器自动化库。它非常适合为 AI、LLM、RAG 和 GPT 模型提取数据,能够处理从下载各种文件类型到与 BeautifulSoup、Playwright 和原生 HTTP 交互的各种任务。它支持有头和无头模式,提供代理轮换和高级功能,用于构建高弹性的爬虫。这个库简化了复杂的爬取任务,确保您的项目高效且成果显著。了解 Crawlee 如何革新开发者进行网络数据收集和自动化。
Crawl4AI:开源的大模型友好型网络爬虫
探索 Crawl4AI,这款为大型语言模型(LLM)和AI智能体量身打造的开源网络爬虫正迅速走红。这款强大工具能够闪电般地提取AI所需数据,助力开发者构建稳健的RAG应用和数据管道。了解其核心功能,包括智能Markdown生成、结构化数据提取、灵活的浏览器控制以及便捷的Docker部署。Crawl4AI是那些希望普及数据获取、并以高质量实时网络内容赋能AI模型的理想选择。
Sniffnet: 跨平台网络流量监控工具
探索 Sniffnet,这是一款直观可靠的开源应用程序,助您轻松监控 Windows、macOS 和 Linux 上的互联网流量。这款强大工具能提供实时洞察、详细统计数据和可自定义的通知,帮助您理解并管理网络活动。无论您是网络安全爱好者,还是仅仅想了解自己的数据流向,Sniffnet 都提供了全面的功能,例如数据包分析、服务识别以及网络连接的地理位置映射。快来体验其用户友好的界面,并了解如何利用这个强大且由社区支持的项目来优化您的网络体验。
使用 ARC 在 Kubernetes 上扩展 GitHub Actions Runner
隆重推出 Actions Runner Controller (ARC),这是一款功能强大的 Kubernetes Operator,专为简化自托管型 GitHub Actions runner 而设计。ARC 能够根据工作流需求动态扩展 runner,确保 CI/CD 流水线高效且经济。 了解这个由 GitHub 和社区专家共同维护的开源项目,如何通过提供基于容器的瞬时 runner,并根据您的工作负载自动调整,从而彻底改变您的 GitHub Actions 设置。 深入了解 ARC 的各项功能,从快速入门指南到高级配置,亲身体验 ARC 如何简化 runner 管理,并为您的 GitHub 仓库、组织或企业优化资源利用。
PayloadsAllTheThings:Web 安全终极备忘录
深入探索“PayloadsAllTheThings”,这是一个对Web应用程序安全至关重要的开源GitHub仓库。该项目由swisskyrepo开发,它汇集了大量渗透测试、漏洞赏金捕获和CTF挑战中不可或缺的有效载荷(payloads)和绕过技术。这个详细的资源涵盖了从SQL注入、XSS到API密钥泄露和配置错误等各种漏洞,并提供了实用的示例和方法。无论您是经验丰富的安全专家还是崭露头角的渗透测试员,该项目都能为您提供系统的知识和工具,以提升您的攻击性安全技能,是您网络安全工具箱中必备的一项资源。
Pot:极致跨平台翻译与文字识别(OCR)工具
探索 Pot,一款功能强大的开源桌面应用程序,它彻底改变了 Windows、macOS 和 Linux 平台上的文本翻译和识别方式。这款多功能工具提供即时逐词翻译、智能屏幕截图 OCR 功能,并广泛支持各类翻译和 OCR 引擎,包括 OpenAI、Gemini Pro 和 Tesseract。Pot 的插件系统支持无限的自定义和集成,使其成为语言学习者、研究人员和专业人士不可或缺的得力助手。了解它的各项功能、安装指南以及它如何简化您的工作流程。
PDFMathTranslate:人工智能驱动的科研PDF翻译
探索PDFMathTranslate,一个创新的开源项目,专为无缝翻译科学PDF而设计。该工具利用人工智能保留文档格式,包括公式、图表和目录,确保高质量的双语输出。它支持谷歌、DeepL、Ollama和OpenAI等服务,提供命令行界面(CLI)、图形用户界面(GUI)和Docker等多种部署选项。PDFMathTranslate是研究人员和学生的理想选择,它能简化阅读和理解复杂的国际科学文献的过程。
Firecrawl:将网站转化为大型语言模型(LLM)可用数据
探索 Firecrawl,这款功能强大的开源网络抓取和爬虫解决方案,专为 AI 应用设计。它能将原始网站数据转化为干净、可供大型语言模型 (LLM) 使用的格式,并与 LlamaIndex 和 Langchain 等热门 AI 工具无缝集成。了解 Firecrawl 如何处理动态内容、提供可靠的数据提取,支持从 AI 对话到深度研究的各种用例,使其成为开发者构建 AI 驱动解决方案的必备工具。免费开始使用,并随着需求增长进行扩展。
Docusaurus:轻松搭建开源文档网站
探索 Docusaurus,Meta 旗下的开源项目,它能助您轻松搭建、部署和维护文档网站。了解这一强大框架如何简化创建精美、支持本地化且高度定制的项目的过程。Docusaurus 是开发者和组织优化文档工作的理想选择,它提供快速设置、博客和版本控制等强大功能,并拥有一个活跃的社区。探索它的强大功能,了解为什么超过 60,000 个项目都选择 Docusaurus 来构建其官方文档。
MarkItDown:微软开源的大语言模型数据准备工具
发现 MarkItDown,这是微软推出的一款功能强大的开源 Python 工具,旨在弥合各类文档格式与大型语言模型(LLMs)之间的鸿沟。这款工具能够智能地将 PDF、Word 文档、Excel 表格、图片、音频乃至 YouTube 链接等文件,转换为简洁、结构化的 Markdown 格式。 对于开发者和 AI 从业者而言,MarkItDown 是理想之选。它能确保文档内容针对 LLM 的输入进行优化,在保留关键结构的同时,最大限度地提升 token 利用效率。了解这个实用项目如何为您的 AI 应用和文本分析简化数据准备工作流程。