Cro-Stem 2.0 🇭🇷⚡

„Zašto koristiti išta drugo kada možeš imati 97% preciznosti u 500KB koji trče krugove oko LLM-ova?“
Dosta je sporih Python modela koji traže 4GB RAM-a za bazično stemiranje. Dosta je regexa koji umiru na drugom padežu. Dosta je alata koji se ne održavaju desetljećima.
Cro-Stem je Grand Slam ponuda za hrvatski NLP.
🚀 Ponuda koju ne možeš odbiti (The $100M Value)
Primijenili smo Hormozijevu jednadžbu vrijednosti na obradu jezika:
- Dream Outcome (San): Savršeno pretraživanje i analiza hrvatskog teksta. Bez gubljenja informacija u padežima. Bez "izgubljenih u prijevodu" momenata.
- Perceived Likelihood (Vjerojatnost): 100%. Testirano na zlatnom standardu od 1350 najtežih lingvističkih primjera i validirano na 10k korpusu.
- Točnost (Aggressive): 97.41%
- Glagoli: 99.0%
- Imenice: 95.0%
- Time Delay (Vrijeme): NULA. 0.1ms po riječi. To nije brzo, to je trenutno. Dok tvoje oko trepne, Cro-Stem je procesirao cijelu knjižnicu.
- Effort & Sacrifice (Trud): NULA. Jedna linija koda za instalaciju. Jedna linija koda za korištenje. Nema konfiguracije. Nema GPU-a. Nema muke.
✨ NOVO u v0.1.7: Hibridna Normalizacija
Ljudski unosi su grozni. Ljudi pišu "sasavi" umjesto "šašavi". Naša nova hibridna normalizacija (PHF Mapa + Heuristička Pravila) automatski "popravlja" dijakritike prije stemiranja.
- Vraća Dijakritike:
zvacuci->žvačući. Automatski. Instantno. - Ujedinjuje Dijalekte: Prepoznaje
lepo(ekavica) ilipo(ikavica) i tretira ih kaolijepo. - Ekstremna Efikasnost: Sve to u svega 116 KB WASM-a koristeći
Cow<'a, str>za nula alokacija memorije gdje god je to moguće.
🛠️ Brzi Start (U 30 Sekundi)
🐍 Python
# Aggressive Mode (97.4% točnosti)
# Output: "vrabac"
🦀 Rust
use ;
let stemmer = new;
assert_eq!;
🔌 Integracije & Ekosustav
- 🦀 Tantivy Integration: Cro-Stem je sada nativni
TokenFilterza najbržu Rust tražilicu. Dostupno out-of-the-box. - 🌐 Playground 2.0: Potpuno lokalizirani web demo s Developer Mode-om.
- Feedback Loop: Pronašao si grešku? Prijavi je direktno u Playgroundu, kopiraj generirani test i pošalji nam ga. 👉 Isprobaj Cro-Stem 2.0 Live
☕️ Dev Corner
- 🚀 Brži od konobara na Rivi: Cro-Stem obrađuje tvoj CSV brže nego što stigneš naručiti kavu s hladnim mlijekom.
- 🛥️ Bez redova za trajekt: Naš Rust engine nema kašnjenja. Za razliku od ulaska na trajekt u špici sezone, ovdje nema čekanja u redu.
- 🏫 Kraj traumama iz škole: Sjećaš se tablica s padežima? Mi smo ih pretvorili u kod da ti više nikada ne bi morao razmišljati o instrumentalu množine.
⚖️ Licenca
Ovaj projekt je besplatan i otvoren. Uzmi ga. Koristi ga. Zaradi milijune s njim. (Licencirano pod MIT ili Apache-2.0 licencom).
👨💻 Autor
Kreirao Denis Ja1Denis. Ako ti je ovaj alat uštedio vrijeme ili novac:
- 📧 Email: sdenis.vr@gmail.com
- 🔗 LinkedIn: Denis Sakač
Također pogledaj: