ai

ScrapeIQ — Web Intelligence Platforma

Browser automation + local LLM enrichment za compliance-sensitive web intelligence.

ScrapeIQ — Web Intelligence Platforma
← Nazad na sve projekte

Tech stack

  • Python
  • Playwright
  • Ollama
  • ChromaDB
  • FastAPI

Problem

Pravni timovi su trebali da prate regulatorna ažuriranja na više državnih portala. Off-the-shelf scraper-i se kvare na JavaScript-heavy sajtovima i nemaju semantičko razumevanje. Cloud LLM-ovi se ne mogu koristiti jer dokumenti podležu data residency pravilima.

Rešenje

ScrapeIQ kombinuje Playwright headless browser automation (koja hendluje auth, dinamičan sadržaj i anti-bot) sa lokalnim Ollama za semantičko enrichment. ChromaDB indeksira sve za downstream querying. Cron-driven scheduled crawl-ovi sa diff detection-om obaveštavaju tim o materijalnim promenama.

Rezultat

Pravni timovi sada dobijaju kurirana, semantički-tagirana regulatorna ažuriranja u roku od minuta od objave. Bez ikakvih podataka koji napuštaju njihovu mrežu.

Imaš projekat na umu?

Reci nam šta želiš da izgradimo. Odgovaramo u roku od jednog radnog dana.