crawlnicle/src/jobs/mod.rs

use apalis::prelude::*;
use reqwest::Client;
use serde::{Deserialize, Serialize};
use sqlx::PgPool;
use thiserror::Error;
use tracing::{error, info, instrument};

mod crawl_feed;

pub use crawl_feed::CrawlFeedJob;

use crate::domain_request_limiter::DomainRequestLimiter;

#[derive(Debug, Deserialize, Serialize, Clone)]
pub enum AsyncJob {
    HelloWorld(String),
    CrawlFeed(CrawlFeedJob),
}

#[derive(Debug, Error)]
pub enum AsyncJobError {
    #[error("error executing job")]
    JobError(#[from] anyhow::Error),
}

#[instrument(skip(job, worker_id), fields(worker_id = %worker_id))]
pub async fn handle_async_job(
    job: AsyncJob,
    worker_id: WorkerId,
    // TODO: add task_id to tracing instrumentation context
    // it casuses a panic in 0.6.0 currently, see: https://github.com/geofmureithi/apalis/issues/398
    // task_id: Data<TaskId>,
    http_client: Data<Client>,
    db: Data<PgPool>,
    domain_request_limiter: Data<DomainRequestLimiter>,
) -> Result<(), AsyncJobError> {
    let result = match job {
        AsyncJob::HelloWorld(name) => {
            info!("Hello, {}!", name);
            Ok(())
        }
        AsyncJob::CrawlFeed(job) => {
            crawl_feed::crawl_feed(job, http_client, db, domain_request_limiter).await
        }
    };

    match result {
        Ok(_) => info!("Job completed successfully"),
        Err(err) => {
            error!("Job failed: {err:?}");
            return Err(AsyncJobError::JobError(err));
        }
    };
    Ok(())
}