🔥
HotRepo
maxun — Phần mềm self-host 🔥 Nền tảng không mã nguồn mở để quét, thu thập thông tin, tìm kiếm và
📦
getmaxun

maxun — Phần mềm self-host 🔥 Nền tảng không mã nguồn mở để quét, thu thập thông tin, tìm kiếm và

🔥 Nền tảng không mã nguồn mở để quét, thu thập thông tin, tìm kiếm và trích xuất dữ liệu AI • Biến trang web thành API có cấu trúc trong vài phút 🔥

15.7k🍴 1.3kTypeScript📜 agpl-3.0🐳 Docker Compose#agents#api#automation#browser-automation

maxun

🔥 Nền tảng không mã nguồn mở để quét, thu thập thông tin, tìm kiếm và trích xuất dữ liệu AI • Biến trang web thành API có cấu trúc trong vài phút 🔥

15,546 stars trên GitHub · 🍴 1,278 forks · 📜 License: agpl-3.0 · 💻 Ngôn ngữ: TypeScript

maxun là gì?

Nếu bạn cần biến dữ liệu web thành API có cấu trúc mà không muốn viết crawler từ đầu, maxun là lựa chọn rất đáng chú ý. Điểm khác biệt của nó nằm ở cách kết hợp no-code, browser automation và AI extraction trong một nền tảng self-host.

Các thành phần chính

  • Tạo “robot” để thao tác trên website như người dùng thật và trích xuất dữ liệu có cấu trúc.
  • Recorder Mode cho phép ghi lại thao tác duyệt web rồi tái sử dụng thành workflow scraping.
  • AI Mode cho phép mô tả dữ liệu cần lấy bằng ngôn ngữ tự nhiên để LLM hỗ trợ extraction.
  • Scrape toàn bộ trang thành Markdown hoặc HTML sạch, kèm khả năng chụp screenshot.
  • Crawl website theo phạm vi kiểm soát được để thu thập nội dung từ nhiều trang liên quan.
  • SDK và CLI giúp developer trigger job, quản lý robot, lấy dữ liệu và tích hợp vào pipeline nội bộ.

Use case rõ ràng

  • Xây API nội bộ từ các website không cung cấp API chính thức.
  • Thu thập listing bất động sản, sản phẩm, giá bán hoặc review từ marketplace để phân tích.
  • Crawl tài liệu, blog, knowledge base để đưa vào RAG, AI agent hoặc hệ thống search nội bộ.
  • Tự động theo dõi kết quả tìm kiếm web theo thời gian, phục vụ market research hoặc monitoring.
  • Cho team vận hành dữ liệu tạo scraping workflow nhanh mà không phụ thuộc hoàn toàn vào developer.

Điểm mạnh nhất là biến scraping thành workflow có thể vận hành được — không chỉ là script lấy dữ liệu một lần, mà có recorder, AI extraction, crawl/search, SDK và CLI để đưa vào hệ thống thật. So với các dịch vụ commercial như Apify hay Octoparse, maxun hấp dẫn hơn với team muốn self-host, kiểm soát dữ liệu và tùy biến sâu mà vẫn giữ trải nghiệm no-code.

Phù hợp cho developer, data engineer, sysadmin và IT manager cần xây hạ tầng web data automation nội bộ, đặc biệt khi dữ liệu nhạy cảm hoặc chi phí scraping SaaS bắt đầu tăng.

Chủ đề: project được tag với các topic phổ biến:

  • 🏷️ agents
  • 🏷️ api
  • 🏷️ automation
  • 🏷️ browser-automation
  • 🏷️ crawler
  • 🏷️ crawling
  • 🏷️ data-extraction
  • 🏷️ no-code
  • 🏷️ nocode
  • 🏷️ playwright

📸 Hình ảnh & screenshot

getmaxun%2Fmaxun | Trendshift

maxun

maxun

Cài đặt nhanh

Project hỗ trợ Docker Compose:

git clone https://github.com/getmaxun/maxun.git
cd maxun
docker compose up -d

Xem README trong repo để biết các biến môi trường cần khai báo.

Yêu cầu hệ thống tối thiểu

Thành phần Khuyến nghị
RAM 1024 MB
CPU 1 vCPU
Disk 15 GB SSD
OS Ubuntu 22.04 LTS / Debian 12
Docker 24.0+

⚡ Triển khai nhanh với VSIS

Dùng gói VSIS VPS Mini 1GB RAM / 1 vCPU / 15GB SSD (~70k/tháng) từ VSIS.NET — VPS Việt Nam tốc độ cao, hỗ trợ 24/7, hợp với nhu cầu chạy maxun ổn định.

🎯 Lợi ích:

  • Triển khai 1 lệnh docker compose up -d chỉ trong 2 phút
  • IPv4 riêng, full root, băng thông không giới hạn nội địa
  • Backup snapshot tự động hàng ngày
  • Trợ giúp cài đặt miễn phí từ team VSIS

👉 Xem các gói VPS phù hợp tại vsis.net

Tài nguyên


Bài viết được tổng hợp từ thông tin GitHub vào 05/05/2026. Số liệu stars/forks có thể đã thay đổi — xem realtime tại link GitHub.