ScrapeIQ

Hibridni RAG i generisanje dokumenata za pravne i regulatorne potrebe.

ScrapeIQ je production-deployed AI asistent za dokumente koji prikuplja i indeksira pravne izvore, vrši hibridnu (vektor + ključna reč) pretragu i generiše drafte dokumenata iz vaših šablona. Ćirilica i latinica podržane out-of-the-box.

  • Hibridna RAG pretraga

    Vektorska sličnost u kombinaciji sa keyword retrieval-om — bolje od bilo koje varijante posebno za guste pravne tekstove.

  • Generisanje dokumenata

    Generišite drafte ugovora, mišljenja i izveštaja iz indeksiranih izvora preko /api/generator endpointa.

  • Compliance audit trail

    /api/audit beleži svaki pristup dokumentu i operaciju; strukturirano za SOC 2 i ISO 27001 audite.

  • Zakazani crawling

    Async job queue sa cron-driven osvežavanjem, diff detection-om i alerting-om.

  • GPU akceleracija

    Opcionalna CUDA inferencija; testirano u produkciji na RTX 6000 Ada.

  • Ćirilica + latinica

    Multi-script normalizacija indeksira srpske, ruske i latinične dokumente kao jedan korpus.

Tech stack

  • Python
  • FastAPI
  • ChromaDB
  • Ollama
  • LangChain
  • Playwright
  • PostgreSQL
  • Docker
ScrapeIQ — Hibridni RAG i generisanje dokumenata za pravne i regulatorne potrebe.

Za koga je

Za timove sa puno dokumenata.

Gde je važno da nađete pravi pasus — i dokažete ko mu je pristupio.

  • Pravni timovi i usklađenost

    Pretražujte zakone, podneske i praksu kroz pisma i sastavljajte iz sopstvenih izvora.

  • Regulatorni poslovi

    Pratite regulatorne promene uz zakazano prikupljanje, detekciju razlika i upozorenja.

  • Znanje i operacije

    Rastuću količinu dokumenata pretvorite u odgovore koje tim može da citira.

Česta pitanja

Često postavljana pitanja

  • Pretraga po ključnim rečima nam već radi — zašto bismo menjali?

    Hibridno pretraživanje dodaje semantički priziv povrh preciznosti tačnih termina, pa u gustim dokumentima propuštate manje relevantnih pasusa, a i dalje pogađate tačne termine koje hvata pretraga po ključnim rečima.

  • Naši dokumenti su na ćirilici — da li to može da obradi?

    Da. Normalizacija više pisama indeksira ćirilicu i latinicu kao jedan korpus, tako da se ništa ne rascepkava u odvojene silose.

  • Možemo li da verujemo generisanim nacrtima?

    Nacrti se grade iz vaših sopstvenih indeksiranih izvora i šablona, a ne iz slobodnog nagađanja modela, i svaka operacija se beleži radi pregleda i strukturirana je za dokaze SOC 2 / ISO 27001.

Imaš projekat na umu?

Reci nam šta želiš da izgradimo. Odgovaramo u roku od jednog radnog dana.