Webscrapingová platforma Apify nabízí vývojářům prostor pro vytváření Aktorů neboli skriptů a cloudových aplikací pro automatizaci úkolů – třeba pro sběr dat z webových stránek i jejich analýzu. Nyní se společnost rozhodla tyto Aktory zkombinovat do pracovních postupů, které pomáhají vývojářům řešit komplexnější problémy. Mezi první tzv. Actor Bundles patří například agregátor hodnocení restaurací, který dokáže shromáždit hodnocení podniků ze služeb Google Maps, DoorDash, Uber Eats, Yelp, Tripadvisor a Facebook.
Samotné Aktory jsou bezserverové cloudové aplikace, které běží na platformě Apify a provádějí výpočetní úlohy. Jejich název odkazuje k hercům, protože podobně, jako se lidští herci řídí scénářem, i Aktory provádějí úlohy podle předepsaného skriptu. Během procesu webscrapingu dokážou navigovat po webových stránkách a stahovat z nich specifická data. Ta následně ukládají do strukturovaného formátu v podobě tabulek či databází.
V praxi vývojáři používají Aktory tak, že je naprogramují k vykonávání konkrétních úkolů, které pak mohou být spuštěny manuálně nebo automatizovaně prostřednictvím Apify platformy nebo API. Vývojáři pak mohou Aktory dále monitorovat, ladit a aktualizovat podle potřeby, například při změnách na cílových webových stránkách, aby zajistili nepřetržitý a správný sběr dat. Kromě toho mohou vývojáři své Aktory nabízet na otevřeném marketplacu, kde si díky tomu mohou vydělat. Actor Bundles tyto možnosti posouvají ještě dál.
„Kombinace jednotlivých Aktorů umožňují vývojářům zvládat složité scénáře a úlohy, jako je stahování dat, jejich analýza a zpracování, které by jinak vyžadovaly manuální nastavení a správu hned několika jednotlivých Aktorů. Tento přístup šetří obrovské množství času a energie. Klienti například nemusejí plýtvat vlastními zdroji na čištění dat, jejich agregaci a vylepšování pomocí řešení třetích stran, jako jsou OpenAI, Google Lens nebo třeba překlady,“ vysvětluje zakladatel a CEO Apify Jan Čurn.

Rychlejší pochopení trhu, zákazníků i konkurence
Automatizovanější sběr dat z webových stránek pomáhá firmám a jednotlivcům lépe porozumět jejich trhu, zákazníkům a konkurenci v kratším čase. Společnosti často používají data získaná z webů konkurence k analýze cenových strategií, produktových nabídek, marketingových kampaní i k získání informací nutných pro vylepšení vlastního produktu.
Nový agregátor hodnocení restaurací využívá k získání správných adres URL hodnocení vyhledávací dotazy Google s názvy restaurací a zeměpisnými souřadnicemi. Nástroj pro analýzu sentimentu v sociálních médiích zase automaticky shromažďuje komentáře z profilů na oblíbených sociálních médiích, Facebooku, Instagramu nebo TikToku, a následně dokáže pomocí jednoduchých technik zpracování přirozeného jazyka analyzovat shromážděná data a určit skóre sentimentu každého komentáře. Další Aktor zase umožňuje sjednotit získávání dat na základě hashtagů ze všech sociálních sítí najednou.
Apify nabízí také integraci nástroje Pinecone pro procházení obsahu webových stránek nebo propojení Pinecone s modelem GPT od společnosti OpenAI.
„Ve vývoji jsou také další ‚Actor Bundles‘, například pro hlubší analýzu sociálních sítí. Věřím, že jde o začátek nové éry marketplacu Apify Store. Brzy bude Apify Store nabízet řešení složitých problémů, které dříve musely vytvářet celé firmy,“ dodává Jan Čurn.
Web scrapingová platforma Apify umožňuje firmám těžit data z webů a získat data pro AI. Zároveň dokáže automatizovat jakékoli workflow, které člověk dělá manuálně ve webovém prohlížeči, a následně jej spustit ve větším měřítku v cloudu. Jednou z klíčových služeb společnosti je také otevřené tržiště s takzvanými Aktory – cloudovými programy, které lze snadno spouštět, sdílet, integrovat a stavět na nich. Těch Apify nabízí přes 1 500. Apify v roce 2015 založili Jan Čurn a Jakub Balada, kteří se poznali během studia informatiky na Matematicko-fyzikální fakultě UK, kdy si také uvědomili, že programování může být vedle zábavy výnosný byznys. Viděli poptávku po softwaru, který by dokázal získávat z webových stránek určitá data, a vytvořili proto platformu, k