Modulo S: Configurazione Sovrana

Corso STREETS per il Reddito degli Sviluppatori — Modulo Gratuito Settimane 1-2 | 6 Lezioni | Deliverable: Il Tuo Documento dello Stack Sovrano

"Il tuo rig è la tua infrastruttura aziendale. Configuralo come tale."

Possiedi già lo strumento più potente per generare reddito che la maggior parte delle persone non avrà mai: una workstation da sviluppatore con connessione internet, calcolo locale e le competenze per collegare tutto insieme.

La maggior parte degli sviluppatori tratta il proprio rig come un prodotto di consumo. Qualcosa su cui giocano, programmano, navigano. Ma quella stessa macchina — quella che hai sotto la scrivania in questo momento — può eseguire inferenza, servire API, elaborare dati e generare entrate 24 ore al giorno mentre dormi.

Questo modulo riguarda il guardare ciò che già hai attraverso una lente diversa. Non "cosa posso costruire?" ma "cosa posso vendere?"

Alla fine di queste due settimane, avrai:

Un inventario chiaro delle tue capacità di generazione di reddito
Uno stack LLM locale di livello produzione
Una base legale e finanziaria (anche se minima)
Un Documento dello Stack Sovrano scritto che diventerà il tuo piano aziendale

Niente giri di parole. Niente "credi in te stesso." Numeri reali, comandi reali, decisioni reali.

Cominciamo.

Lezione 1: L'Audit del Rig

"Non ti serve una 4090. Ecco cosa conta davvero."

La Tua Macchina È un Asset Aziendale

Quando un'azienda valuta la propria infrastruttura, non si limita a elencare le specifiche — mappa le capacità alle opportunità di guadagno. È esattamente quello che farai adesso.

Apri un terminale e segui i passaggi seguenti. Scrivi ogni numero. Ti serviranno per il Documento dello Stack Sovrano nella Lezione 6.

Inventario Hardware

CPU

# Linux/Mac
lscpu | grep "Model name\|CPU(s)\|Thread(s)"
# oppure
cat /proc/cpuinfo | grep "model name" | head -1
nproc

# Windows (PowerShell)
Get-CimInstance -ClassName Win32_Processor | Select-Object Name, NumberOfCores, NumberOfLogicalProcessors

# macOS
sysctl -n machdep.cpu.brand_string
sysctl -n hw.ncpu

Cosa conta per il reddito:

Il numero di core determina quanti task concorrenti il tuo rig può gestire. Eseguire un LLM locale mentre contemporaneamente elabori un job in batch richiede vero parallelismo.
Per la maggior parte dei motori di guadagno in questo corso, qualsiasi CPU moderna 8+ core degli ultimi 5 anni è sufficiente.
Se esegui LLM locali solo su CPU (senza GPU), ti servono 16+ core. Un Ryzen 7 5800X o Intel i7-12700 è il minimo pratico.

RAM

# Linux
free -h

# macOS
sysctl -n hw.memsize | awk '{print $0/1073741824 " GB"}'

# Windows (PowerShell)
(Get-CimInstance -ClassName Win32_ComputerSystem).TotalPhysicalMemory / 1GB

Cosa conta per il reddito:

16 GB: Minimo indispensabile. Puoi eseguire modelli 7B e fare lavoro di automazione base.
32 GB: Confortevole. Esegui modelli 13B localmente, gestisci più progetti, mantieni il tuo ambiente di sviluppo attivo insieme ai carichi di lavoro produttivi.
64 GB+: Puoi eseguire modelli 30B+ su CPU, o tenere più modelli caricati. Qui le cose diventano interessanti per vendere servizi di inferenza.

GPU

# NVIDIA
nvidia-smi

# Controllare specificamente la VRAM
nvidia-smi --query-gpu=name,memory.total,memory.free --format=csv

# AMD (Linux)
rocm-smi

# macOS (Apple Silicon)
system_profiler SPDisplaysDataType

Cosa conta per il reddito:

Questa è l'unica specifica su cui le persone sono ossessionate, e qui c'è la verità onesta: la tua GPU determina il tuo livello di LLM locale, e il tuo livello di LLM locale determina quali flussi di reddito funzionano più velocemente. Ma non determina se puoi guadagnare o no.

VRAM	Capacità LLM	Rilevanza per il Reddito
0 (solo CPU)	Modelli 7B a ~5 token/sec	Elaborazione batch, lavoro asincrono. Lento ma funzionale.
6-8 GB (RTX 3060, ecc.)	Modelli 7B a ~30 tok/sec, 13B quantizzato	Sufficiente per la maggior parte dei flussi di reddito da automazione.
12 GB (RTX 3060 12GB, 4070)	13B a piena velocità, 30B quantizzato	Punto ottimale. La maggior parte dei motori di guadagno funziona bene qui.
16-24 GB (RTX 4090, 3090)	Modelli 30B-70B	Livello premium. Vendi qualità che altri non possono eguagliare localmente.
48 GB+ (doppia GPU, A6000)	70B+ a velocità	Inferenza locale di livello enterprise. Serio vantaggio competitivo.
Apple Silicon 32GB+ (M2/M3 Pro/Max)	30B+ usando memoria unificata	Eccellente efficienza. Costo energetico inferiore rispetto all'equivalente NVIDIA.

Nessuna GPU dedicata rilevata. Eseguirai l'inferenza su CPU, il che significa ~5-12 token/sec su modelli 7B. Va bene per elaborazione batch e lavoro asincrono. Usa chiamate API per colmare il gap di velocità per output rivolti ai clienti.

Parliamoci Chiaro: Se hai una RTX 3060 12GB, sei in una posizione migliore del 95% degli sviluppatori che cercano di monetizzare l'IA. Smetti di aspettare una 4090. La 3060 12GB è la Honda Civic dell'IA locale — affidabile, efficiente, fa il suo lavoro. I soldi che spenderesti per un upgrade della GPU sono meglio spesi in crediti API per qualità rivolta ai clienti mentre i tuoi modelli locali gestiscono il lavoro pesante.

Storage

# Linux/Mac
df -h

# Windows (PowerShell)
Get-PSDrive -PSProvider FileSystem | Select-Object Name, @{N='Used(GB)';E={[math]::Round($_.Used/1GB,1)}}, @{N='Free(GB)';E={[math]::Round($_.Free/1GB,1)}}

Cosa conta per il reddito:

I modelli LLM occupano spazio: modello 7B = ~4 GB, 13B = ~8 GB, 70B = ~40 GB (quantizzato).
Ti serve spazio per dati di progetto, database, cache e artefatti di output.
L'SSD è imprescindibile per qualsiasi cosa rivolta ai clienti. Il caricamento dei modelli da HDD aggiunge 30-60 secondi di tempo di avvio.
Minimo pratico: 500 GB SSD con almeno 100 GB liberi.
Confortevole: 1 TB SSD. Tieni i modelli sull'SSD, archivia su HDD.

Rete

# Speed test rapido (installa speedtest-cli se necessario)
# pip install speedtest-cli
speedtest-cli --simple

# Oppure controlla semplicemente il tuo piano
# La velocità di upload conta più del download per servire contenuti

Cosa conta per il reddito:

Velocità di download: 50+ Mbps. Necessaria per scaricare modelli, pacchetti e dati.
Velocità di upload: Questo è il collo di bottiglia che la maggior parte delle persone ignora. Se stai servendo qualcosa (API, risultati elaborati, deliverable), l'upload conta.
- 10 Mbps: Adeguato per consegna asincrona (file elaborati, risultati batch).
- 50+ Mbps: Necessario se stai eseguendo qualsiasi tipo di endpoint API locale che servizi esterni interrogano.
- 100+ Mbps: Confortevole per tutto in questo corso.
Latenza: Sotto 50ms verso i principali provider cloud. Esegui ping api.openai.com e ping api.anthropic.com per verificare.

Uptime

Questa è la specifica a cui nessuno pensa, ma che separa gli hobbisti da chi guadagna mentre dorme.

Chiediti:

Il tuo rig può funzionare 24/7? (Alimentazione, raffreddamento, rumore)
Hai un UPS per le interruzioni di corrente?
La tua connessione internet è abbastanza stabile per workflow automatizzati?
Puoi accedere via SSH alla tua macchina da remoto se qualcosa si rompe?

Se non puoi funzionare 24/7, va bene — molti flussi di reddito in questo corso sono job batch asincroni che avvii manualmente. Ma quelli che generano reddito veramente passivo richiedono uptime.

Setup rapido uptime (se lo desideri):

# Abilita Wake-on-LAN (controlla il BIOS)
# Configura l'accesso SSH
sudo systemctl enable ssh  # Linux

# Auto-riavvio su crash (esempio servizio systemd)
# /etc/systemd/system/my-income-worker.service
[Unit]
Description=Income Worker Process
After=network.target

[Service]
Type=simple
ExecStart=/usr/local/bin/my-worker
Restart=always
RestartSec=10

[Install]
WantedBy=multi-user.target

La Matematica dell'Elettricità

Le persone o ignorano questo aspetto o lo drammatizzano. Facciamo vera matematica.

Misurare il tuo consumo reale:

# Se hai un misuratore Kill-A-Watt o una presa smart con monitoraggio:
# Misura a riposo, sotto carico (inferenza in esecuzione) e al massimo (GPU a pieno utilizzo)

# Stime approssimative se non hai un misuratore:
# Desktop (senza GPU, a riposo): 60-100W
# Desktop (GPU di fascia media, a riposo): 80-130W
# Desktop (GPU di fascia alta, a riposo): 100-180W
# Desktop (GPU sotto carico inferenza): aggiungi il 50-80% del TDP della GPU
# Laptop: 15-45W
# Mac Mini M2: 7-15W (sul serio)
# Laptop Apple Silicon: 10-30W

Calcolo del costo mensile:

Costo mensile = (Watt / 1000) x Ore x Prezzo per kWh

Esempio: Desktop con RTX 3060, inferenza in esecuzione 8 ore/giorno, a riposo 16 ore/giorno
- Inferenza: (250W / 1000) x 8h x 30 giorni x $0.12/kWh = $7.20/mese
- Riposo: (100W / 1000) x 16h x 30 giorni x $0.12/kWh = $5.76/mese
- Totale: ~$13/mese

Esempio: Stesso rig, inferenza 24/7
- (250W / 1000) x 24h x 30 giorni x $0.12/kWh = $21.60/mese

Esempio: Mac Mini M2, 24/7
- (12W / 1000) x 24h x 30 giorni x $0.12/kWh = $1.04/mese

La media USA dell'elettricità è circa $0.12/kWh. Controlla la tua tariffa reale — varia enormemente. La California potrebbe essere $0.25/kWh. Alcuni paesi europei arrivano a $0.35/kWh. Alcune zone del Midwest USA sono a $0.08/kWh.

Il punto: Far funzionare il tuo rig 24/7 per generare reddito costa da qualche parte tra $1 e $30/mese in elettricità. Se i tuoi flussi di reddito non coprono quello, il problema non è l'elettricità — è il flusso di reddito.

Specifiche Minime per Tipo di Motore di Guadagno

Ecco un'anteprima di dove stiamo andando nel corso STREETS completo. Per ora, controlla semplicemente dove si posiziona il tuo rig:

Motore di Guadagno	CPU	RAM	GPU	Storage	Rete
Automazione contenuti (post blog, newsletter)	4+ core	16 GB	Opzionale (fallback API)	50 GB liberi	10 Mbps up
Servizi di elaborazione dati	8+ core	32 GB	Opzionale	200 GB liberi	50 Mbps up
Servizi API di IA locale	8+ core	32 GB	8+ GB VRAM	100 GB liberi	50 Mbps up
Strumenti di generazione codice	8+ core	16 GB	8+ GB VRAM o API	50 GB liberi	10 Mbps up
Elaborazione documenti	4+ core	16 GB	Opzionale	100 GB liberi	10 Mbps up
Agenti autonomi	8+ core	32 GB	12+ GB VRAM	100 GB liberi	50 Mbps up

Errore Comune: "Devo aggiornare il mio hardware prima di poter iniziare." No. Inizia con quello che hai. Usa chiamate API per colmare i gap che il tuo hardware non copre. Aggiorna quando il guadagno lo giustifica — non prima.

Checkpoint Lezione 1

Dovresti ora aver annotato:

[ ] Modello CPU, core e thread
[ ] Quantità di RAM
[ ] Modello GPU e VRAM (o "nessuna")
[ ] Storage disponibile
[ ] Velocità di rete (down/up)
[ ] Costo mensile stimato dell'elettricità per operatività 24/7
[ ] Per quali categorie di motori di guadagno il tuo rig è qualificato

Conserva questi numeri. Li inserirai nel tuo Documento dello Stack Sovrano nella Lezione 6.

Nel corso STREETS completo, il Modulo R (Motori di Guadagno) ti dà playbook specifici, passo dopo passo, per ogni tipo di motore elencato sopra — incluso il codice esatto per costruirli e distribuirli.

Lezione 2: Lo Stack LLM Locale

"Configura Ollama per uso in produzione — non solo per chattare."

Perché gli LLM Locali Contano per il Reddito

Ogni volta che chiami l'API di OpenAI, stai pagando un affitto. Ogni volta che esegui un modello localmente, quell'inferenza è gratuita dopo la configurazione iniziale. La matematica è semplice:

GPT-4o: ~$5 per milione di token in input, ~$15 per milione di token in output
Claude 3.5 Sonnet: ~$3 per milione di token in input, ~$15 per milione di token in output
Llama 3.1 8B locale: $0 per milione di token (solo elettricità)

Se stai costruendo servizi che elaborano migliaia di richieste, la differenza tra $0 e $5-$15 per milione di token è la differenza tra profitto e pareggio.

Ma ecco la sfumatura che la maggior parte delle persone non coglie: i modelli locali e le API servono ruoli diversi in uno stack di reddito. I modelli locali gestiscono il volume. Le API gestiscono l'output di qualità critica, rivolto ai clienti. Il tuo stack ha bisogno di entrambi.

Installare Ollama

Ollama è la base. Trasforma la tua macchina in un server di inferenza locale con un'API pulita.

# Linux
curl -fsSL https://ollama.com/install.sh | sh

# macOS
# Scarica da https://ollama.com oppure:
brew install ollama

# Windows
# Scarica l'installer da https://ollama.com
# Oppure usa winget:
winget install Ollama.Ollama

Verifica l'installazione:

ollama --version
# Dovrebbe mostrare versione 0.5.x o superiore (controlla https://ollama.com/download per l'ultima versione)

# Avvia il server (se non si avvia automaticamente)
ollama serve

# In un altro terminale, testalo:
ollama run llama3.1:8b "Salutami in esattamente 5 parole"

Nota sulla versione: Ollama rilascia aggiornamenti frequentemente. I comandi modello e i flag in questo modulo sono stati verificati con Ollama v0.5.x (inizio 2026). Se stai leggendo questo più tardi, controlla ollama.com/download per l'ultima versione e ollama.com/library per i nomi dei modelli attuali. I concetti fondamentali non cambiano, ma tag specifici dei modelli (es. llama3.1:8b) potrebbero essere superati da versioni più recenti.

Guida alla Selezione dei Modelli

Non scaricare ogni modello che vedi. Sii strategico. Ecco cosa scaricare e quando usare ciascuno.

Livello 1: Il Cavallo di Battaglia (modelli 7B-8B)

# Scarica il tuo modello cavallo di battaglia
ollama pull llama3.1:8b
# Alternativa: mistral (buono per lingue europee)
ollama pull mistral:7b

Usa per:

Classificazione testo ("Questa email è spam o legittima?")
Riassunti (condensare documenti lunghi in punti elenco)
Estrazione dati semplice (estrarre nomi, date, importi dal testo)
Analisi del sentiment
Tagging e categorizzazione contenuti
Generazione embedding (se usi un modello con supporto embedding)

Performance (tipiche):

RTX 3060 12GB: ~40-60 token/secondo
RTX 4090: ~100-130 token/secondo
M2 Pro 16GB: ~30-45 token/secondo
Solo CPU (Ryzen 7 5800X): ~8-12 token/secondo

Confronto costi:

1 milione di token via GPT-4o-mini: ~$0.60
1 milione di token localmente (modello 8B): ~$0.003 in elettricità
Punto di pareggio: ~5.000 token (risparmi dal letteralmente primo richiesta)

Livello 2: La Scelta Bilanciata (modelli 13B-14B)

# Scarica il tuo modello bilanciato
ollama pull llama3.1:14b
# Oppure per task di coding:
ollama pull deepseek-coder-v2:16b

Usa per:

Redazione contenuti (post del blog, documentazione, testi di marketing)
Generazione codice (funzioni, script, boilerplate)
Trasformazione dati complessa
Task di ragionamento multi-step
Traduzione con sfumature

Performance (tipiche):

RTX 3060 12GB: ~20-30 token/secondo (quantizzato)
RTX 4090: ~60-80 token/secondo
M2 Pro 32GB: ~20-30 token/secondo
Solo CPU: ~3-6 token/secondo (non pratico per tempo reale)

Quando usare rispetto al 7B: Quando la qualità dell'output del 7B non è abbastanza buona ma non devi pagare per chiamate API. Testa entrambi sul tuo caso d'uso reale — a volte il 7B va bene e stai solo sprecando calcolo.

Livello 3: Il Livello Qualità (modelli 30B-70B)

# Scarica questi solo se hai la VRAM necessaria
# 30B richiede ~20GB VRAM, 70B richiede ~40GB VRAM (quantizzato)
ollama pull llama3.1:70b-instruct-q4_K_M
# Oppure l'eccellente ma più piccolo:
ollama pull qwen2.5:32b

Usa per:

Contenuti rivolti ai clienti che devono essere eccellenti
Analisi e ragionamento complessi
Generazione di contenuti lunghi
Task dove la qualità impatta direttamente se qualcuno ti paga

Performance (tipiche):

RTX 4090 (24GB): 70B a ~8-15 token/secondo (usabile ma lento)
Doppia GPU o 48GB+: 70B a ~20-30 token/secondo
M3 Max 64GB: 70B a ~10-15 token/secondo

Parliamoci Chiaro: Se non hai 24GB+ di VRAM, salta completamente i modelli 70B. Usa chiamate API per output di qualità critica. Un modello 70B che gira a 3 token/secondo dalla RAM di sistema è tecnicamente possibile ma praticamente inutile per qualsiasi workflow che generi reddito. Il tuo tempo ha valore.

Livello 4: Modelli API (Quando il Locale Non Basta)

I modelli locali sono per volume e privacy. I modelli API sono per tetti di qualità e capacità specializzate.

Quando usare modelli API:

Output rivolto ai clienti dove qualità = guadagno (testi di vendita, contenuti premium)
Catene di ragionamento complesse su cui i modelli più piccoli sbagliano
Task di visione/multimodali (analisi di immagini, screenshot, documenti)
Quando ti serve output JSON strutturato con alta affidabilità
Quando la velocità conta e il tuo hardware locale è lento

Tabella di confronto costi (inizio 2025 — controlla i prezzi attuali):

Modello	Input (per 1M token)	Output (per 1M token)	Migliore Per
GPT-4o-mini	$0.15	$0.60	Lavoro di volume economico (quando il locale non è disponibile)
GPT-4o	$2.50	$10.00	Visione, ragionamento complesso
Claude 3.5 Sonnet	$3.00	$15.00	Codice, analisi, contesto lungo
Claude 3.5 Haiku	$0.80	$4.00	Veloce, economico, buon equilibrio qualità
DeepSeek V3	$0.27	$1.10	Economico, performance solide

La strategia ibrida:

LLM locale 7B/13B gestisce l'80% delle richieste (classificazione, estrazione, riassunti)
API gestisce il 20% delle richieste (passaggio di qualità finale, task complessi, output rivolto ai clienti)
Il tuo costo effettivo: ~$0.50-2.00 per milione di token misto (invece di $5-15 solo API)

Questo approccio ibrido è come costruisci servizi con margini sani. Approfondiremo nel Modulo R.

Configurazione di Produzione

Eseguire Ollama per lavoro produttivo è diverso dall'eseguirlo per chat personale. Ecco come configurarlo correttamente.

Imposta le Variabili d'Ambiente

# Crea/modifica la configurazione di Ollama
# Linux: /etc/systemd/system/ollama.service o variabili d'ambiente
# macOS: ambiente launchctl o ~/.zshrc
# Windows: Variabili d'Ambiente di Sistema

# Impostazioni chiave:
export OLLAMA_HOST=127.0.0.1:11434    # Bind solo a localhost (sicurezza)
export OLLAMA_NUM_PARALLEL=4            # Gestione richieste concorrenti
export OLLAMA_MAX_LOADED_MODELS=2       # Mantieni 2 modelli in memoria
export OLLAMA_KEEP_ALIVE=30m            # Tieni il modello caricato per 30 min dopo l'ultima richiesta
export OLLAMA_MAX_QUEUE=100             # Accoda fino a 100 richieste

Crea un Modelfile per il Tuo Carico di Lavoro

Invece di usare le impostazioni di default del modello, crea un Modelfile personalizzato calibrato per il tuo carico di lavoro produttivo:

# Salva come: Modelfile-worker
FROM llama3.1:8b

# Calibrato per output di produzione consistente
PARAMETER temperature 0.3
PARAMETER top_p 0.9
PARAMETER num_ctx 4096
PARAMETER repeat_penalty 1.1

# Prompt di sistema per il tuo carico di lavoro più comune
SYSTEM """You are a precise data processing assistant. You follow instructions exactly. You output only what is requested, with no preamble or explanation unless asked. When given structured output formats (JSON, CSV, etc.), you output only the structure with no markdown formatting."""

# Crea il tuo modello personalizzato
ollama create worker -f Modelfile-worker

# Testalo
ollama run worker "Extract all email addresses from this text: Contact us at hello@example.com or support@test.org for more info."

Batching e Gestione delle Code

Per carichi di lavoro produttivi, spesso dovrai elaborare molti elementi. Ecco un setup base di batching:

#!/usr/bin/env python3
"""
batch_processor.py — Elabora elementi attraverso LLM locale con accodamento.
Batching di livello produzione per carichi di lavoro redditizi.
"""

import requests
import json
import time
import concurrent.futures
from pathlib import Path

OLLAMA_URL = "http://127.0.0.1:11434/api/generate"
MODEL = "worker"  # Il tuo modello personalizzato dal precedente
MAX_CONCURRENT = 4
MAX_RETRIES = 3

def process_item(item: dict) -> dict:
    """Elabora un singolo elemento attraverso l'LLM locale."""
    payload = {
        "model": MODEL,
        "prompt": item["prompt"],
        "stream": False,
        "options": {
            "num_ctx": 4096,
            "temperature": 0.3
        }
    }

    for attempt in range(MAX_RETRIES):
        try:
            response = requests.post(OLLAMA_URL, json=payload, timeout=120)
            response.raise_for_status()
            result = response.json()
            return {
                "id": item["id"],
                "input": item["prompt"][:100],
                "output": result["response"],
                "tokens": result.get("eval_count", 0),
                "duration_ms": result.get("total_duration", 0) / 1_000_000,
                "status": "success"
            }
        except Exception as e:
            if attempt == MAX_RETRIES - 1:
                return {
                    "id": item["id"],
                    "output": None,
                    "error": str(e),
                    "status": "failed"
                }
            time.sleep(2 ** attempt)  # Backoff esponenziale

def process_batch(items: list[dict], output_file: str = "results.jsonl"):
    """Elabora un batch di elementi con esecuzione concorrente."""
    results = []
    start_time = time.time()

    with concurrent.futures.ThreadPoolExecutor(max_workers=MAX_CONCURRENT) as executor:
        future_to_item = {executor.submit(process_item, item): item for item in items}

        for i, future in enumerate(concurrent.futures.as_completed(future_to_item)):
            result = future.result()
            results.append(result)

            # Scrittura incrementale (non perdere i progressi in caso di crash)
            with open(output_file, "a") as f:
                f.write(json.dumps(result) + "\n")

            # Report dei progressi
            elapsed = time.time() - start_time
            rate = (i + 1) / elapsed
            remaining = (len(items) - i - 1) / rate if rate > 0 else 0
            print(f"[{i+1}/{len(items)}] {result['status']} | "
                  f"{rate:.1f} elementi/sec | "
                  f"ETA: {remaining:.0f}s")

    # Riepilogo
    succeeded = sum(1 for r in results if r["status"] == "success")
    failed = sum(1 for r in results if r["status"] == "failed")
    total_time = time.time() - start_time

    print(f"\nBatch completato: {succeeded} riusciti, {failed} falliti, "
          f"{total_time:.1f}s totali")

    return results

# Esempio di utilizzo:
if __name__ == "__main__":
    # I tuoi elementi da elaborare
    items = [
        {"id": i, "prompt": f"Summarize this in one sentence: {text}"}
        for i, text in enumerate(load_your_data())  # Sostituisci con la tua fonte dati
    ]

    results = process_batch(items)

Benchmarking del TUO Rig

Non fidarti dei benchmark di altri. Misura i tuoi:

# Script di benchmark rapido
# Salva come: benchmark.sh

#!/bin/bash
MODELS=("llama3.1:8b" "mistral:7b")
PROMPT="Write a detailed 200-word product description for a wireless mechanical keyboard designed for programmers."

for model in "${MODELS[@]}"; do
    echo "=== Benchmarking: $model ==="

    # Riscaldamento (la prima esecuzione carica il modello in memoria)
    ollama run "$model" "Hello" > /dev/null 2>&1

    # Esecuzione cronometrata
    START=$(date +%s%N)
    RESULT=$(curl -s http://localhost:11434/api/generate -d "{
        \"model\": \"$model\",
        \"prompt\": \"$PROMPT\",
        \"stream\": false
    }")
    END=$(date +%s%N)

    DURATION=$(( (END - START) / 1000000 ))
    TOKENS=$(echo "$RESULT" | python3 -c "import sys,json; print(json.load(sys.stdin).get('eval_count', 'N/A'))")

    echo "Tempo: ${DURATION}ms"
    echo "Token generati: $TOKENS"
    if [ "$TOKENS" != "N/A" ] && [ "$DURATION" -gt 0 ]; then
        TPS=$(python3 -c "print(f'{$TOKENS / ($DURATION / 1000):.1f}')")
        echo "Velocità: $TPS token/secondo"
    fi
    echo ""
done

chmod +x benchmark.sh
./benchmark.sh

Annota i tuoi token/secondo per ogni modello. Questo numero determina quali workflow produttivi sono pratici per il tuo rig.

Requisiti di velocità per caso d'uso:

Elaborazione batch (asincrona): 5+ token/sec va bene (non ti interessa la latenza)
Strumenti interattivi (l'utente aspetta): 20+ token/sec minimo
API in tempo reale (rivolto ai clienti): 30+ token/sec per una buona UX
Chat in streaming: 15+ token/sec per risultare reattivo

Messa in Sicurezza del Tuo Server di Inferenza Locale

La tua istanza Ollama non dovrebbe mai essere accessibile da internet a meno che tu non lo intenda esplicitamente.

# Verifica che Ollama sia in ascolto solo su localhost
ss -tlnp | grep 11434
# Dovrebbe mostrare 127.0.0.1:11434, NON 0.0.0.0:11434

# Se hai bisogno di accesso remoto (es., da un'altra macchina sulla tua LAN):
# Usa il tunneling SSH invece di esporre la porta
ssh -L 11434:localhost:11434 your-rig-ip

# Regole firewall (Linux)
sudo ufw deny in 11434
sudo ufw allow from 192.168.1.0/24 to any port 11434  # Solo LAN, se necessario

Errore Comune: Collegare Ollama a 0.0.0.0 per "comodità" e dimenticarsene. Chiunque trovi il tuo IP può usare la tua GPU per inferenza gratuita. Peggio, possono estrarre pesi del modello e prompt di sistema. Sempre localhost. Sempre tunnel.

Checkpoint Lezione 2

Dovresti ora avere:

[ ] Ollama installato e in esecuzione
[ ] Almeno un modello cavallo di battaglia scaricato (llama3.1:8b o equivalente)
[ ] Un Modelfile personalizzato per il tuo carico di lavoro previsto
[ ] Numeri di benchmark: token/secondo per ogni modello sul tuo rig
[ ] Ollama collegato solo a localhost

Nel corso STREETS completo, il Modulo T (Fossati Tecnici) ti mostra come costruire configurazioni di modelli proprietarie, pipeline di fine-tuning e toolchain personalizzate che i concorrenti non possono facilmente replicare. Il Modulo R (Motori di Guadagno) ti dà i servizi esatti da costruire sopra questo stack.

Lezione 3: Il Vantaggio della Privacy

"La tua configurazione privata È un vantaggio competitivo — non solo una preferenza."

La Privacy È una Caratteristica del Prodotto, Non una Limitazione

La maggior parte degli sviluppatori configura l'infrastruttura locale perché valuta personalmente la privacy, o perché si diverte a sperimentare. Va bene. Ma stai lasciando soldi sul tavolo se non ti rendi conto che la privacy è una delle caratteristiche più commerciabili nella tecnologia in questo momento.

Ecco perché: ogni volta che un'azienda invia dati all'API di OpenAI, quei dati passano attraverso un terzo. Per molte imprese — specialmente quelle nella sanità, finanza, legale, governo e aziende con sede nell'UE — questo è un problema reale. Non teorico. Un problema del tipo "non possiamo usare questo strumento perché la compliance ha detto no".

Tu, che esegui modelli localmente sulla tua macchina, non hai quel problema.

Il Vento in Poppa Normativo

L'ambiente normativo si muove nella tua direzione. Velocemente.

EU AI Act (applicato dal 2024-2026):

I sistemi IA ad alto rischio necessitano di pipeline di elaborazione dati documentate
Le aziende devono dimostrare dove fluiscono i dati e chi li elabora
L'elaborazione locale semplifica drasticamente la conformità
Le aziende UE cercano attivamente fornitori di servizi IA che possano garantire la residenza dei dati nell'UE

GDPR (già applicato):

"L'elaborazione dei dati" include l'invio di testo a un'API LLM
Le aziende hanno bisogno di Accordi per il Trattamento dei Dati con ogni terza parte
L'elaborazione locale elimina completamente la terza parte
Questo è un vero punto di vendita: "I tuoi dati non lasciano mai la tua infrastruttura. Non c'è nessun DPA di terze parti da negoziare."

Normative specifiche di settore:

HIPAA (Sanità USA): I dati dei pazienti non possono essere inviati ad API IA consumer senza un BAA (Business Associate Agreement). La maggior parte dei provider IA non offre BAA per l'accesso API. L'elaborazione locale aggira completamente questo problema.
SOC 2 (Enterprise): Le aziende sottoposte a audit SOC 2 devono documentare ogni elaboratore di dati. Meno elaboratori = audit più facili.
ITAR (Difesa USA): I dati tecnici controllati non possono lasciare la giurisdizione USA. I provider IA cloud con infrastruttura internazionale sono problematici.
PCI DSS (Finanza): L'elaborazione dei dati delle carte di credito ha requisiti rigorosi su dove viaggiano i dati.

Come Posizionare la Privacy nelle Conversazioni di Vendita

Non devi essere un esperto di conformità. Devi capire tre frasi e sapere quando usarle:

Frase 1: "I tuoi dati non lasciano mai la tua infrastruttura." Usa quando: Parli con qualsiasi prospect attento alla privacy. Questo è il gancio universale.

Frase 2: "Nessun accordo di trattamento dati con terze parti necessario." Usa quando: Parli con aziende europee o qualsiasi azienda con un team legale/compliance. Questo risparmia loro settimane di revisione legale.

Frase 3: "Audit trail completo, elaborazione single-tenant." Usa quando: Parli con enterprise o industrie regolamentate. Devono dimostrare la loro pipeline IA agli auditor.

Esempio di posizionamento (per la tua pagina servizi o le tue proposte):

"A differenza dei servizi IA basati sul cloud, [Il Tuo Servizio] elabora tutti i dati localmente su hardware dedicato. I tuoi documenti, codice e dati non lasciano mai l'ambiente di elaborazione. Non ci sono API di terze parti nella pipeline, nessun accordo di condivisione dati da negoziare, e log di audit completi di ogni operazione. Questo rende [Il Tuo Servizio] adatto per organizzazioni con requisiti rigorosi di gestione dati, inclusi ambienti di conformità GDPR, HIPAA e SOC 2."

Quel paragrafo, su una landing page, attirerà esattamente i clienti che pagheranno tariffe premium.

La Giustificazione del Prezzo Premium

Ecco il business case in numeri concreti:

Servizio di elaborazione IA standard (usando API cloud):

I dati del cliente vanno a OpenAI/Anthropic/Google
Stai competendo con ogni sviluppatore che può chiamare un'API
Tariffa di mercato: $0.01-0.05 per documento elaborato
Stai essenzialmente rivendendo l'accesso API con un markup

Servizio di elaborazione IA privacy-first (il tuo stack locale):

I dati del cliente restano sulla tua macchina
Stai competendo con un pool molto più piccolo di fornitori
Tariffa di mercato: $0.10-0.50 per documento elaborato (premium 5-10x)
Stai vendendo infrastruttura + competenza + conformità

Il premium della privacy è reale: da 5x a 10x rispetto ai servizi cloud commodity per lo stesso task sottostante. E i clienti che lo pagano sono più fedeli, meno sensibili al prezzo e hanno budget più grandi.

Configurare Workspace Isolati

Se hai un lavoro diurno (la maggior parte di voi ce l'ha), hai bisogno di una separazione netta tra il lavoro per il datore di lavoro e il lavoro produttivo. Questa non è solo protezione legale — è igiene operativa.

Opzione 1: Account utente separati (consigliato)

# Linux: Crea un utente dedicato per il lavoro produttivo
sudo useradd -m -s /bin/bash income
sudo passwd income

# Passa all'utente income per tutto il lavoro di guadagno
su - income

# Tutti i progetti di guadagno, chiavi API e dati vivono sotto /home/income/

Opzione 2: Workspace containerizzati

# Isolamento basato su Docker
# Crea un container di workspace dedicato

# docker-compose.yml
version: '3.8'
services:
  income-workspace:
    image: ubuntu:22.04
    volumes:
      - ./income-projects:/workspace
      - ./income-data:/data
    environment:
      - OLLAMA_HOST=host.docker.internal:11434
    network_mode: bridge
    # La VPN, gli strumenti, ecc. del tuo datore di lavoro NON sono in questo container

Opzione 3: Macchina fisica separata (la più blindata)

Se fai sul serio e il tuo reddito lo giustifica, una macchina dedicata elimina tutte le domande. Un Dell OptiPlex usato con una RTX 3060 costa $400-600 e si ripaga nel primo mese di lavoro per clienti.

Checklist di separazione minima:

[ ] Progetti di guadagno in una directory separata (mai mescolati con repo del datore di lavoro)
[ ] Chiavi API separate per il lavoro di guadagno (mai usare chiavi fornite dal datore di lavoro)
[ ] Profilo browser separato per account legati al guadagno
[ ] Il lavoro di guadagno non viene mai fatto su hardware del datore di lavoro
[ ] Il lavoro di guadagno non viene mai fatto sulla rete del datore di lavoro (usa il tuo internet personale o una VPN)
[ ] Account GitHub/GitLab separato per i progetti di guadagno (opzionale ma pulito)

Errore Comune: Usare la chiave API OpenAI del tuo datore di lavoro "solo per testare" il tuo progetto personale. Questo crea una traccia cartacea che la dashboard di fatturazione del tuo datore di lavoro può vedere, e confonde le acque sulla proprietà intellettuale. Prendi le tue chiavi. Sono economiche.

Checkpoint Lezione 3

Dovresti ora comprendere:

[ ] Perché la privacy è una caratteristica di prodotto commerciabile, non solo una preferenza personale
[ ] Quali normative creano domanda per l'elaborazione IA locale
[ ] Tre frasi da usare nelle conversazioni di vendita sulla privacy
[ ] Come i servizi privacy-first comandano un prezzo premium 5-10x
[ ] Come separare il lavoro di guadagno dal lavoro per il datore di lavoro

Nel corso STREETS completo, il Modulo E (Vantaggio in Evoluzione) ti insegna come tracciare i cambiamenti normativi e posizionarti davanti ai nuovi requisiti di conformità prima che i tuoi concorrenti sappiano della loro esistenza.

Lezione 4: Il Minimo Legale

"Quindici minuti di preparazione legale adesso prevengono mesi di problemi dopo."

Questo Non È un Consiglio Legale

Sono uno sviluppatore, non un avvocato. Ciò che segue è una checklist pratica che la maggior parte degli sviluppatori nella maggior parte delle situazioni dovrebbe affrontare. Se la tua situazione è complessa (equity nel tuo datore di lavoro, non-compete con termini specifici, ecc.), spendi $200 per una consulenza di 30 minuti con un avvocato del lavoro. È il miglior ROI che otterrai.

Passo 1: Leggi il Tuo Contratto di Lavoro

Trova il tuo contratto di lavoro o lettera di assunzione. Cerca queste sezioni:

Clausola di cessione della proprietà intellettuale — Cerca linguaggio come:

"Tutte le invenzioni, sviluppi e prodotti del lavoro..."
"...creati durante il periodo di impiego..."
"...relativi all'attività della Società o attività prevista..."

Frasi chiave che ti limitano:

"Tutto il prodotto del lavoro creato durante l'impiego appartiene alla Società" (ampio — potenzialmente problematico)
"Prodotto del lavoro creato usando risorse della Società" (più ristretto — di solito va bene se usi la tua attrezzatura)
"Relativo all'attività corrente o prevista della Società" (dipende da cosa fa il tuo datore di lavoro)

Frasi chiave che ti liberano:

"Escludendo il lavoro fatto interamente nel tempo libero del Dipendente con le risorse proprie del Dipendente e non correlato all'attività della Società" (questa è la tua deroga — molti stati USA la richiedono)
Alcuni stati (California, Washington, Minnesota, Illinois, altri) hanno leggi che limitano le pretese di PI del datore di lavoro sui progetti personali, indipendentemente da cosa dice il contratto.

Il Test delle 3 Domande

Per qualsiasi progetto di guadagno, chiediti:

Tempo: Stai facendo questo lavoro nel tuo tempo libero? (Non durante l'orario di lavoro, non durante turni di reperibilità)
Attrezzatura: Stai usando il tuo hardware, il tuo internet, le tue chiavi API? (Non il laptop del datore di lavoro, non la VPN del datore di lavoro, non gli account cloud del datore di lavoro)
Materia: Questo è non correlato all'attività del tuo datore di lavoro? (Se lavori in un'azienda di IA sanitaria e vuoi vendere servizi di IA sanitaria... è un problema. Se lavori in un'azienda di IA sanitaria e vuoi vendere elaborazione documenti per agenti immobiliari... va bene.)

Se tutte e tre le risposte sono pulite, sei quasi certamente a posto. Se qualsiasi risposta è ambigua, chiarisci prima di procedere.

Parliamoci Chiaro: La stragrande maggioranza degli sviluppatori che fanno lavoro extra non ha mai problemi. I datori di lavoro si preoccupano di proteggere i vantaggi competitivi, non di impedirti di guadagnare soldi extra su progetti non correlati. Ma "quasi certamente a posto" non è "sicuramente a posto." Se il tuo contratto è insolitamente ampio, fai una conversazione con il tuo manager o le HR — o consulta un avvocato. Il lato negativo del non controllare è molto peggio dell'imbarazzo moderato di chiedere.

Passo 2: Scegli una Struttura Aziendale

Hai bisogno di un'entità legale per separare i tuoi beni personali dalle tue attività commerciali, e per aprire la porta a conti bancari aziendali, elaborazione pagamenti e benefici fiscali.

Stati Uniti

Struttura	Costo	Protezione	Migliore Per
Ditta Individuale (default)	$0	Nessuna (responsabilità personale)	Testare il terreno. Primi $1K.
LLC a Membro Singolo	$50-500 (varia per stato)	Protezione dei beni personali	Lavoro di reddito attivo. La maggior parte degli sviluppatori dovrebbe iniziare qui.
Elezione S-Corp (su una LLC)	Costo LLC + $0 per l'elezione	Stessa della LLC + benefici fiscali sui contributi	Quando guadagni costantemente $40K+/anno da questo

Consigliato per sviluppatori USA: LLC a Membro Singolo nel tuo stato di residenza.

Stati più economici per la costituzione: Wyoming ($100, nessuna imposta sul reddito statale), New Mexico ($50), Montana ($70). Ma costituire nel tuo stato di residenza è di solito il più semplice a meno che tu non abbia un motivo specifico per non farlo.

Come fare:

Vai al sito web del Secretary of State del tuo stato
Cerca "form LLC" o "business entity filing"
Compila gli Articles of Organization (modulo da 10 minuti)
Ottieni un EIN dall'IRS (gratuito, richiede 5 minuti su irs.gov)

Regno Unito

Struttura	Costo	Protezione	Migliore Per
Sole Trader	Gratuito (registrazione con HMRC)	Nessuna	Primo reddito. Test.
Limited Company (Ltd)	~$15 via Companies House	Protezione dei beni personali	Qualsiasi lavoro di reddito serio.

Consigliato: Ltd company via Companies House. Richiede circa 20 minuti e costa GBP 12.

Unione Europea

Varia significativamente per paese, ma lo schema generale:

Germania: Einzelunternehmer (ditta individuale) per iniziare, GmbH per lavoro serio (ma la GmbH richiede EUR 25.000 di capitale — considera UG per EUR 1)
Paesi Bassi: Eenmanszaak (ditta individuale, registrazione gratuita) o BV (comparabile alla Ltd)
Francia: Micro-entrepreneur (semplificato, consigliato per iniziare)
Estonia: e-Residency + OUE (popolare per non residenti, completamente online)

Australia

Struttura	Costo	Protezione	Migliore Per
Sole Trader	ABN gratuito	Nessuna	Per iniziare
Pty Ltd	~AUD 500-800 via ASIC	Protezione dei beni personali	Reddito serio

Consigliato: Inizia con un ABN da Sole Trader (gratuito, istantaneo), passa a Pty Ltd quando guadagni costantemente.

Passo 3: Elaborazione Pagamenti (setup di 15 minuti)

Hai bisogno di un modo per essere pagato. Configuralo adesso, non quando il tuo primo cliente sta aspettando.

Stripe (consigliato per la maggior parte degli sviluppatori):

1. Vai a stripe.com
2. Crea un account con la tua email aziendale
3. Completa la verifica dell'identità
4. Collega il tuo conto bancario aziendale
5. Ora puoi accettare pagamenti, creare fatture e impostare abbonamenti

Tempo: ~15 minuti. Puoi iniziare ad accettare pagamenti immediatamente (Stripe trattiene i fondi per 7 giorni sui nuovi account).

Lemon Squeezy (consigliato per prodotti digitali):

Se stai vendendo prodotti digitali (template, strumenti, corsi, SaaS), Lemon Squeezy agisce come Merchant of Record. Questo significa:

Gestiscono la tassa sulle vendite, IVA e GST per te globalmente
Non devi registrarti per l'IVA nell'UE
Gestiscono rimborsi e contestazioni

1. Vai a lemonsqueezy.com
2. Crea un account
3. Configura il tuo negozio
4. Aggiungi i prodotti
5. Loro gestiscono tutto il resto

Stripe Atlas (per sviluppatori internazionali o chi vuole un'entità USA):

Se sei fuori dagli USA ma vuoi vendere a clienti USA con un'entità USA:

$500 una tantum
Crea una LLC Delaware per te
Configura un conto bancario USA (via Mercury o Stripe)
Fornisce servizio di agente registrato
Richiede circa 1-2 settimane

Passo 4: Privacy Policy e Termini di Servizio

Se stai vendendo qualsiasi servizio o prodotto online, ti servono questi. Non pagare un avvocato per il boilerplate.

Fonti gratuite e affidabili per template:

Termly.io — Generatore gratuito di privacy policy e ToS. Rispondi alle domande, ottieni i documenti.
Avodocs.com — Documenti legali open-source per startup. Gratuiti.
choosealicense.com di GitHub — Per licenze di progetti open-source specificamente.
Policy open-source di Basecamp — Cerca "Basecamp open source policies" — buoni template in linguaggio semplice.

Cosa deve coprire la tua privacy policy (se elabori dati dei clienti):

Quali dati raccogli
Come li elabori (localmente — questo è il tuo vantaggio)
Per quanto tempo li conservi
Come i clienti possono richiedere la cancellazione
Se terze parti accedono ai dati (idealmente: nessuna)

Tempo: 30 minuti con un generatore di template. Fatto.

Passo 5: Conto Bancario Separato

Non far passare il reddito aziendale attraverso il tuo conto corrente personale. Le ragioni:

Chiarezza fiscale: Quando arriva il momento delle tasse, devi sapere esattamente cosa era reddito aziendale e cosa no.
Protezione legale: Se hai una LLC, mescolare fondi personali e aziendali può "perforare il velo societario" — significa che un tribunale può ignorare la protezione di responsabilità della tua LLC.
Professionalità: Fatture da "Consulenza di Mario Srl" che arrivano su un conto aziendale dedicato sembrano legittime. Pagamenti sul tuo PayPal personale no.

Conto bancario aziendale gratuito o a basso costo:

Mercury (USA) — Gratuito, progettato per startup. Eccellente API se vuoi automatizzare la contabilità in seguito.
Relay (USA) — Gratuito, buono per separare i flussi di reddito in sotto-conti.
Starling Bank (UK) — Conto aziendale gratuito.
Wise Business (Internazionale) — Multi-valuta a basso costo. Ottimo per ricevere pagamenti in USD, EUR, GBP, ecc.
Qonto (UE) — Conto bancario aziendale pulito per aziende europee.

Apri il conto adesso. Richiede 10-15 minuti online e 1-3 giorni per la verifica.

Passo 6: Basi Fiscali per il Reddito Extra degli Sviluppatori

Parliamoci Chiaro: Le tasse sono la cosa che la maggior parte degli sviluppatori ignora fino ad aprile, e poi va nel panico. Spendere 30 minuti adesso ti fa risparmiare soldi veri e stress.

Stati Uniti:

Il reddito extra oltre $400/anno richiede la tassa di lavoro autonomo (~15.3% per Social Security + Medicare)
Più la tua aliquota regolare sull'imposta sul reddito sull'utile netto
Tasse stimate trimestrali: Se dovrai più di $1.000 in tasse, l'IRS si aspetta pagamenti trimestrali (15 aprile, 15 giugno, 15 settembre, 15 gennaio). Il pagamento insufficiente comporta sanzioni.
Metti da parte il 25-30% del reddito netto per le tasse. Mettilo in un conto risparmio separato immediatamente.

Detrazioni comuni per il reddito extra degli sviluppatori:

Costi API (OpenAI, Anthropic, ecc.) — 100% deducibili
Acquisti hardware usati per l'attività — ammortizzabili o deduzione Sezione 179
Costo dell'elettricità attribuibile all'uso aziendale
Abbonamenti software usati per il lavoro produttivo
Deduzione per ufficio domestico (semplificata: $5/sq ft, fino a 300 sq ft = $1.500)
Internet (percentuale di uso aziendale)
Nomi di dominio, hosting, servizi email
Sviluppo professionale (corsi, libri) relativi al tuo lavoro produttivo

Regno Unito:

Dichiarazione tramite Self Assessment
Reddito commerciale sotto GBP 1.000: esentasse (Trading Allowance)
Oltre: paghi Income Tax + Class 4 NICs sui profitti
Date di pagamento: 31 gennaio e 31 luglio

Traccia tutto dal primo giorno. Usa un semplice foglio di calcolo se nient'altro:

| Data       | Categoria   | Descrizione            | Importo | Tipo    |
|------------|-------------|------------------------|---------|---------|
| 2025-01-15 | API         | Credito Anthropic      | -$20.00 | Spesa   |
| 2025-01-18 | Ricavo      | Fattura cliente #001   | +$500.00| Entrata |
| 2025-01-20 | Software    | Piano Vercel Pro       | -$20.00 | Spesa   |
| 2025-01-20 | Riserva Tax | 30% del reddito netto  | -$138.00| Trasf.  |

Errore Comune: "Le tasse le capirò dopo." Dopo è il Q4, devi $3.000 in tasse stimate più sanzioni, e hai già speso i soldi. Automatizza: ogni volta che il reddito arriva sul tuo conto aziendale, trasferisci il 30% su un conto risparmio tasse immediatamente.

Checkpoint Lezione 4

Dovresti ora avere (o avere un piano per):

[ ] Letto la clausola PI del tuo contratto di lavoro
[ ] Superato il Test delle 3 Domande per il tuo lavoro di guadagno pianificato
[ ] Scelta una struttura aziendale (o deciso di iniziare come ditta individuale)
[ ] Elaborazione pagamenti configurata (Stripe o Lemon Squeezy)
[ ] Privacy policy e ToS da un generatore di template
[ ] Conto bancario aziendale separato (o richiesta inviata)
[ ] Strategia fiscale: accantonamento del 30% + calendario pagamenti trimestrali

Nel corso STREETS completo, il Modulo E (Playbook di Esecuzione) include template di modellazione finanziaria che calcolano automaticamente i tuoi obblighi fiscali, la redditività del progetto e i punti di pareggio per ogni motore di guadagno.

Lezione 5: Il Budget di $200/mese

"La tua attività ha un burn rate. Conoscilo. Controllalo. Fallo rendere."

Perché $200/mese

Duecento dollari al mese è il budget minimo viabile per un'operazione di reddito per sviluppatori. È abbastanza per gestire servizi reali, servire clienti reali e generare ricavi reali. È anche abbastanza piccolo che se niente funziona, non hai puntato tutto.

L'obiettivo è semplice: trasformare $200/mese in $600+/mese entro 90 giorni. Se riesci a farlo, hai un'attività. Se non riesci, cambi strategia — non aumenti il budget.

La Ripartizione del Budget

Livello 1: Crediti API — $50-100/mese

Questo è il tuo calcolo di produzione per la qualità rivolta ai clienti.

Allocazione iniziale consigliata:

Anthropic (Claude):     $40/mese  — Il tuo principale per output di qualità
OpenAI (GPT-4o-mini):   $20/mese  — Lavoro di volume economico, fallback
DeepSeek:               $10/mese  — Task economici, sperimentazione
Buffer:                 $30/mese  — Overflow o test di nuovi provider

Come gestire la spesa API:

# Semplice tracker del budget API — esegui giornalmente via cron
# Salva come: check_api_spend.py

import requests
import json
from datetime import datetime

# Controlla l'utilizzo Anthropic
# (Anthropic fornisce l'utilizzo nella dashboard; ecco come tracciare localmente)

MONTHLY_BUDGET = {
    "anthropic": 40.00,
    "openai": 20.00,
    "deepseek": 10.00,
}

# Traccia localmente registrando ogni costo di chiamata API
USAGE_LOG = "api_usage.jsonl"

def get_monthly_spend(provider: str) -> float:
    """Calcola la spesa del mese corrente per un provider."""
    current_month = datetime.now().strftime("%Y-%m")
    total = 0.0
    try:
        with open(USAGE_LOG, "r") as f:
            for line in f:
                entry = json.loads(line)
                if entry["provider"] == provider and entry["date"].startswith(current_month):
                    total += entry["cost"]
    except FileNotFoundError:
        pass
    return total

def log_api_call(provider: str, tokens_in: int, tokens_out: int, model: str):
    """Registra una chiamata API per il tracking del budget."""
    # Costo per 1M token (aggiorna questi quando cambiano i prezzi)
    PRICING = {
        "claude-3.5-sonnet": {"input": 3.00, "output": 15.00},
        "claude-3.5-haiku": {"input": 0.80, "output": 4.00},
        "gpt-4o-mini": {"input": 0.15, "output": 0.60},
        "gpt-4o": {"input": 2.50, "output": 10.00},
        "deepseek-v3": {"input": 0.27, "output": 1.10},
    }

    prices = PRICING.get(model, {"input": 1.0, "output": 5.0})
    cost = (tokens_in / 1_000_000 * prices["input"]) + \
           (tokens_out / 1_000_000 * prices["output"])

    entry = {
        "date": datetime.now().isoformat(),
        "provider": provider,
        "model": model,
        "tokens_in": tokens_in,
        "tokens_out": tokens_out,
        "cost": round(cost, 6),
    }

    with open(USAGE_LOG, "a") as f:
        f.write(json.dumps(entry) + "\n")

    # Avviso budget
    monthly_spend = get_monthly_spend(provider)
    budget = MONTHLY_BUDGET.get(provider, 0)
    if monthly_spend > budget * 0.8:
        print(f"ATTENZIONE: spesa {provider} a {monthly_spend:.2f}/{budget:.2f} "
              f"({monthly_spend/budget*100:.0f}%)")

    return cost

La strategia di spesa ibrida:

Usa LLM locali per l'80% dell'elaborazione (classificazione, estrazione, riassunti, bozze)
Usa chiamate API per il 20% dell'elaborazione (passaggio finale di qualità, ragionamento complesso, output rivolto ai clienti)
Il tuo costo effettivo per task cala drasticamente rispetto all'uso puro di API

Livello 2: Infrastruttura — $30-50/mese

Nome di dominio:        $12/anno ($1/mese)     — Namecheap, Cloudflare, Porkbun
Email (aziendale):      $0-6/mese              — Zoho Mail gratuito, o Google Workspace $6
VPS (opzionale):        $5-20/mese             — Per ospitare servizi leggeri
                                                  Hetzner ($4), DigitalOcean ($6), Railway ($5)
DNS/CDN:                $0/mese                — Cloudflare piano gratuito
Hosting (statico):      $0/mese                — Vercel, Netlify, Cloudflare Pages (piani gratuiti)

Ti serve un VPS?

Se il tuo modello di reddito è:

Vendere prodotti digitali: No. Ospita su Vercel/Netlify gratuitamente. Usa Lemon Squeezy per la consegna.
Elaborazione asincrona per clienti: Forse. Puoi eseguire job sul tuo rig locale e consegnare risultati. Un VPS aggiunge affidabilità.
Offrire un servizio API: Sì, probabilmente. Un VPS da $5-10 funge da gateway API leggero, anche se l'elaborazione pesante avviene sulla tua macchina locale.
Vendere SaaS: Sì. Ma inizia con il piano più economico e scala.

Infrastruttura iniziale consigliata:

Rig locale — calcolo principale, inferenza LLM, elaborazione pesante
   |
   +-- Tunnel SSH o VPN WireGuard
   |
VPS $5 (Hetzner/DigitalOcean) — gateway API, ricevitore webhook, hosting statico
   |
   +-- Cloudflare (gratuito) — DNS, CDN, protezione DDoS
   |
Vercel/Netlify (gratuito) — sito marketing, landing page, documentazione

Costo totale infrastruttura: $5-20/mese. Il resto sono piani gratuiti.

Livello 3: Strumenti — $20-30/mese

Analytics:              $0/mese    — Plausible Cloud ($9) o self-hosted,
                                      o Vercel Analytics (piano gratuito)
                                      o semplicemente Cloudflare analytics (gratuito)
Email marketing:        $0/mese    — Buttondown (gratuito fino a 100 iscritti),
                                      Resend ($0 per 3K email/mese)
Monitoraggio:           $0/mese    — UptimeRobot (gratuito, 50 monitor),
                                      Better Stack (piano gratuito)
Design:                 $0/mese    — Figma (gratuito), Canva (piano gratuito)
Contabilità:            $0/mese    — Wave (gratuito), o un foglio di calcolo
                                      Hledger (gratuito, contabilità in testo semplice)

Parliamoci Chiaro: Puoi gestire l'intero stack di strumenti su piani gratuiti quando inizi. I $20-30 allocati qui sono per quando superi i piani gratuiti o vuoi una funzionalità premium specifica. Non spenderli solo perché sono nel budget. Il budget non speso è profitto.

Livello 4: Riserva — $0-30/mese

Questo è il tuo fondo "cose che non ho previsto":

Un picco di costi API da un job batch inaspettatamente grande
Uno strumento di cui hai bisogno per un progetto specifico di un cliente
Acquisto di dominio d'emergenza quando trovi il nome perfetto
Un acquisto una tantum (tema, template, set di icone)

Se non usi la riserva, si accumula. Dopo 3 mesi di riserva inutilizzata, considera di riallocare a crediti API o infrastruttura.

Il Calcolo del ROI

Questo è l'unico numero che conta:

Ricavi Mensili - Costi Mensili = Profitto Netto
Profitto Netto / Costi Mensili = Multiplo ROI

Esempio:
$600 ricavi - $200 costi = $400 profitto
$400 / $200 = 2x ROI

L'obiettivo: 3x ROI ($600+ ricavi su $200 di spesa)
Il minimo: 1x ROI ($200 ricavi = pareggio)
Sotto 1x: Cambia strategia o riduci i costi

Quando aumentare il budget:

Aumenta il tuo budget SOLO quando:

Sei costantemente a 2x+ ROI per 2+ mesi
Più spesa aumenterebbe direttamente i ricavi (es., più crediti API = più capacità per i clienti)
L'aumento è legato a un flusso di reddito specifico e testato

Quando NON aumentare il budget:

"Penso che questo nuovo strumento aiuterà" (testa prima le alternative gratuite)
"Tutti dicono che devi spendere soldi per fare soldi" (non a questo stadio)
"Un VPS più grande renderà il mio servizio più veloce" (la velocità è davvero il collo di bottiglia?)
Non hai ancora raggiunto 1x ROI (sistema i ricavi, non la spesa)

La scala di crescita:

$200/mese  → Provare il concetto (mesi 1-3)
$500/mese  → Scalare ciò che funziona (mesi 4-6)
$1000/mese → Flussi di reddito multipli (mesi 6-12)
$2000+/mese → Operazione aziendale completa (anno 2+)

Ogni passo richiede di provare il ROI al livello attuale prima.

Errore Comune: Trattare i $200 come un "investimento" che non deve restituire soldi immediatamente. No. Questo è un esperimento con una scadenza di 90 giorni. Se $200/mese non generano $200/mese di ricavi entro 90 giorni, qualcosa nella strategia deve cambiare. I soldi, il mercato, l'offerta — qualcosa non funziona. Sii onesto con te stesso.

Checkpoint Lezione 5

Dovresti ora avere:

[ ] Un budget mensile di ~$200 allocato su quattro livelli
[ ] Account API creati con limiti di spesa impostati
[ ] Decisioni infrastrutturali prese (solo locale vs. locale + VPS)
[ ] Uno stack di strumenti selezionato (principalmente piani gratuiti per iniziare)
[ ] Obiettivi ROI: 3x entro 90 giorni
[ ] Una regola chiara: aumenta il budget solo dopo aver provato il ROI

Nel corso STREETS completo, il Modulo E (Playbook di Esecuzione) include un template di dashboard finanziaria che traccia la tua spesa, i ricavi e il ROI per motore di guadagno in tempo reale — così sai sempre quali flussi sono redditizi e quali necessitano aggiustamenti.

Lezione 6: Il Tuo Documento dello Stack Sovrano

"Ogni attività ha un piano. Questo è il tuo — e sta in due pagine."

Il Deliverable

Questa è la cosa più importante che creerai nel Modulo S. Il tuo Documento dello Stack Sovrano è un riferimento unico che cattura tutto sulla tua infrastruttura per generare reddito. Lo riferirai per tutto il resto del corso STREETS, lo aggiornerai man mano che la tua configurazione evolve, e lo userai per prendere decisioni lucide su cosa costruire e cosa saltare.

Crea un nuovo file. Markdown, Google Doc, pagina Notion, testo semplice — qualunque cosa manterrai effettivamente. Usa il template sotto, compilando ogni campo con i numeri e le decisioni delle Lezioni 1-5.

Il Template

Copia l'intero template e compilalo. Ogni campo. Niente scorciatoie.

# Documento dello Stack Sovrano
# [Il Tuo Nome o Nome dell'Attività]
# Creato: [Data]
# Ultimo Aggiornamento: [Data]

---

## 1. INVENTARIO HARDWARE

### Macchina Principale
- **Tipo:** [Desktop / Laptop / Mac / Server]
- **CPU:** [Modello] — [X] core, [X] thread
- **RAM:** [X] GB [DDR4/DDR5]
- **GPU:** [Modello] — [X] GB VRAM (o "Nessuna — inferenza solo CPU")
- **Storage:** [X] GB SSD liberi / [X] GB totali
- **OS:** [Distribuzione Linux / versione macOS / versione Windows]

### Rete
- **Download:** [X] Mbps
- **Upload:** [X] Mbps
- **Latenza verso API cloud:** [X] ms
- **Affidabilità ISP:** [Stabile / Interruzioni occasionali / Inaffidabile]

### Capacità di Uptime
- **Può funzionare 24/7:** [Sì / No — motivo]
- **UPS:** [Sì / No]
- **Accesso remoto:** [SSH / RDP / Tailscale / Nessuno]

### Costo Infrastruttura Mensile
- **Elettricità (stima 24/7):** $[X]/mese
- **Internet:** $[X]/mese (porzione aziendale)
- **Costo infrastruttura fisso totale:** $[X]/mese

---

## 2. STACK LLM

### Modelli Locali (via Ollama)
| Modello | Dimensione | Token/sec | Caso d'Uso |
|---------|-----------|-----------|------------|
| [es., llama3.1:8b] | [X]B | [X] tok/s | [es., Classificazione, estrazione] |
| [es., mistral:7b] | [X]B | [X] tok/s | [es., Riassunti, bozze] |
| [es., deepseek-coder] | [X]B | [X] tok/s | [es., Generazione codice] |

### Modelli API (per output di qualità critica)
| Provider | Modello | Budget Mensile | Caso d'Uso |
|----------|---------|---------------|------------|
| [es., Anthropic] | [Claude 3.5 Sonnet] | $[X] | [es., Contenuti rivolti ai clienti] |
| [es., OpenAI] | [GPT-4o-mini] | $[X] | [es., Fallback elaborazione volume] |

### Strategia di Inferenza
- **Il locale gestisce:** [X]% delle richieste ([elenco task])
- **Le API gestiscono:** [X]% delle richieste ([elenco task])
- **Costo misto stimato per 1M token:** $[X]

---

## 3. BUDGET MENSILE

| Categoria | Allocazione | Effettivo (aggiorna mensilmente) |
|-----------|-----------|--------------------------------|
| Crediti API | $[X] | $[  ] |
| Infrastruttura (VPS, dominio, email) | $[X] | $[  ] |
| Strumenti (analytics, email marketing) | $[X] | $[  ] |
| Riserva | $[X] | $[  ] |
| **Totale** | **$[X]** | **$[  ]** |

### Obiettivo di Ricavo
- **Mese 1-3:** $[X]/mese (minimo: coprire i costi)
- **Mese 4-6:** $[X]/mese
- **Mese 7-12:** $[X]/mese

---

## 4. STATO LEGALE

- **Stato occupazionale:** [Dipendente / Freelance / Tra un lavoro e l'altro]
- **Clausola PI revisionata:** [Sì / No / N/A]
- **Livello di rischio clausola PI:** [Pulita / Ambigua — da approfondire / Restrittiva]
- **Entità aziendale:** [LLC / Ltd / Ditta Individuale / Ancora nessuna]
  - **Stato/Paese:** [Dove registrata]
  - **Codice Fiscale/P.IVA:** [Ottenuto / In attesa / Non necessario ancora]
- **Elaborazione pagamenti:** [Stripe / Lemon Squeezy / Altro] — [Attivo / In attesa]
- **Conto bancario aziendale:** [Aperto / In attesa / Uso personale (sistema questo)]
- **Privacy policy:** [Fatta / Non ancora — URL: ___]
- **Termini di servizio:** [Fatti / Non ancora — URL: ___]

---

## 5. INVENTARIO TEMPO

- **Ore disponibili a settimana per progetti di reddito:** [X] ore
  - **Mattine giorni feriali:** [X] ore
  - **Sere giorni feriali:** [X] ore
  - **Fine settimana:** [X] ore
- **Fuso orario:** [Il tuo fuso orario]
- **Migliori blocchi di lavoro profondo:** [es., "Sabato 6-12, sere feriali 20-22"]

### Piano di Allocazione Tempo
| Attività | Ore/settimana |
|----------|--------------|
| Costruzione/coding | [X] |
| Marketing/vendite | [X] |
| Lavoro per clienti/consegna | [X] |
| Apprendimento/sperimentazione | [X] |
| Admin (fatturazione, email, ecc.) | [X] |

> Regola: Non allocare mai più del 70% del tempo disponibile.
> La vita succede. Il burnout è reale. Lascia un buffer.

---

## 6. INVENTARIO COMPETENZE

### Competenze Principali (cose che potresti insegnare ad altri)
1. [Competenza] — [anni di esperienza]
2. [Competenza] — [anni di esperienza]
3. [Competenza] — [anni di esperienza]

### Competenze Secondarie (competente ma non esperto)
1. [Competenza]
2. [Competenza]
3. [Competenza]

### In Esplorazione (stai imparando ora o vuoi imparare)
1. [Competenza]
2. [Competenza]

### Combinazioni Uniche
Cosa rende la TUA combinazione di competenze insolita? (Questo diventa il tuo fossato nel Modulo T)
- [es., "Conosco sia Rust CHE gli standard dei dati sanitari — pochissime persone hanno entrambi"]
- [es., "Posso costruire app full-stack E capisco la logistica della supply chain da una carriera precedente"]
- [es., "Parlo correntemente 3 lingue E so programmare — posso servire mercati non anglofoni che la maggior parte degli strumenti dev ignora"]

---

## 7. RIEPILOGO STACK SOVRANO

### Cosa Posso Offrire Oggi
(In base a hardware + competenze + tempo, cosa potresti vendere QUESTA SETTIMANA se qualcuno lo chiedesse?)
1. [es., "Elaborazione documenti locale — estrazione dati da PDF in modo privato"]
2. [es., "Script di automazione personalizzati per [dominio specifico]"]
3. [es., "Scrittura tecnica / documentazione"]

### Cosa Sto Costruendo
(In base al framework STREETS completo — compila questo man mano che avanzi nel corso)
1. [Motore di Guadagno 1 — dal Modulo R]
2. [Motore di Guadagno 2 — dal Modulo R]
3. [Motore di Guadagno 3 — dal Modulo R]

### Vincoli Chiave
(Sii onesto — questi non sono debolezze, sono parametri)
- [es., "Solo 10 ore/settimana disponibili"]
- [es., "Nessuna GPU — inferenza solo CPU, mi appoggerò alle API per task LLM"]
- [es., "Il contratto di lavoro è restrittivo — devo restare in domini non correlati"]
- [es., "Non basato negli USA — alcune opzioni di pagamento/legali sono limitate"]

---

*Questo documento è un riferimento vivo. Aggiornalo mensilmente.*
*Prossima data di revisione: [Data + 30 giorni]*

Come Usare Questo Documento

Prima di iniziare qualsiasi nuovo progetto: Controlla il tuo Stack Sovrano. Hai l'hardware, il tempo, le competenze e il budget per eseguire?
Prima di comprare qualsiasi cosa: Controlla la tua allocazione budget. Questo acquisto è nel piano?
Revisione mensile: Aggiorna la colonna "Effettivo" nel tuo budget. Aggiorna i numeri dei ricavi. Aggiusta le allocazioni in base a cosa funziona.
Quando qualcuno chiede cosa fai: La tua sezione "Cosa Posso Offrire Oggi" è il tuo pitch istantaneo.
Quando sei tentato di inseguire una nuova idea brillante: Controlla i tuoi vincoli. Rientra nel tuo tempo, competenze e hardware? Se no, aggiungilo a "Cosa Sto Costruendo" per dopo.

L'Esercizio di Un'Ora

Imposta un timer per 60 minuti. Compila ogni campo del template. Non pensarci troppo. Non fare ricerche approfondite. Scrivi quello che sai adesso. Potrai aggiornarlo dopo.

I campi che non riesci a compilare? Quelli sono i tuoi action item per questa settimana:

Numeri di benchmark vuoti? Esegui lo script di benchmark dalla Lezione 2.
Nessuna entità aziendale? Inizia il processo di costituzione dalla Lezione 4.
Nessuna elaborazione pagamenti? Configura Stripe dalla Lezione 4.
Inventario competenze vuoto? Spendi 15 minuti elencando tutto per cui sei stato pagato negli ultimi 5 anni.

Errore Comune: Passare 3 ore a rendere il documento "perfetto" invece di 1 ora a renderlo "fatto." Il Documento dello Stack Sovrano è un riferimento di lavoro, non un business plan per investitori. Nessuno lo vedrà tranne te. La precisione conta. La formattazione no.

Checkpoint Lezione 6

Dovresti ora avere:

[ ] Un Documento dello Stack Sovrano completo salvato da qualche parte che aprirai davvero
[ ] Tutte e sei le sezioni compilate con numeri reali (non aspirazioanali)
[ ] Una lista chiara di action item per le lacune nella tua configurazione
[ ] Una data fissata per la tua prima revisione mensile (30 giorni da ora)

Modulo S: Completato

Cosa Hai Costruito in Due Settimane

Guarda cosa hai adesso che non avevi quando hai iniziato:

Un inventario hardware mappato alle capacità di generazione di reddito — non solo specifiche su un adesivo.
Uno stack LLM locale di livello produzione con Ollama, testato sul tuo hardware reale, configurato per carichi di lavoro reali.
Un vantaggio sulla privacy che sai come commercializzare — con linguaggio specifico per audience specifiche.
Una base legale e finanziaria — entità aziendale (o piano), elaborazione pagamenti, conto bancario, strategia fiscale.
Un budget controllato con obiettivi ROI chiari e una scadenza di 90 giorni per provare il modello.
Un Documento dello Stack Sovrano che cattura tutto quanto sopra in un unico riferimento che userai per ogni decisione futura.

Questo è più di quanto la maggior parte degli sviluppatori configuri mai. Sul serio. La maggior parte delle persone che vuole generare reddito extra salta direttamente a "costruire qualcosa di figo" e poi si chiede perché non riesce a farsi pagare. Ora hai l'infrastruttura per farti pagare.

Ma l'infrastruttura senza direzione è solo un hobby costoso. Devi sapere dove puntare questo stack.

Cosa Viene Dopo: Modulo T — Fossati Tecnici

Il Modulo S ti ha dato le fondamenta. Il Modulo T risponde alla domanda critica: come costruisci qualcosa che i concorrenti non possono facilmente copiare?

Ecco cosa copre il Modulo T:

Pipeline di dati proprietarie — come creare dataset a cui solo tu hai accesso, legalmente ed eticamente
Configurazioni modello personalizzate — fine-tuning e prompt engineering che producono qualità di output che altri non possono eguagliare con le impostazioni di default
Stack di competenze che compongono — perché "Python + sanità" batte "Python + JavaScript" per il reddito, e come identificare la tua combinazione unica
Barriere tecniche all'ingresso — design infrastrutturali che richiederebbero mesi a un concorrente per replicare
L'Audit del Fossato — un framework per valutare se il tuo progetto ha un vantaggio difendibile o è solo un altro servizio commodity

La differenza tra uno sviluppatore che fa $500/mese e uno che fa $5.000/mese è raramente la competenza. Sono i fossati. Cose che rendono la tua offerta difficile da replicare, anche se qualcuno ha lo stesso hardware e gli stessi modelli.

La Roadmap STREETS Completa

Modulo	Titolo	Focus	Durata
S	Configurazione Sovrana	Infrastruttura, legale, budget	Settimane 1-2 (completato)
T	Fossati Tecnici	Vantaggi difendibili, asset proprietari	Settimane 3-4
R	Motori di Guadagno	Playbook di monetizzazione specifici con codice	Settimane 5-8
E	Playbook di Esecuzione	Sequenze di lancio, pricing, primi clienti	Settimane 9-10
E	Vantaggio in Evoluzione	Restare avanti, rilevamento trend, adattamento	Settimane 11-12
T	Automazione Tattica	Automatizzare le operazioni per reddito passivo	Settimane 13-14
S	Sovrapposizione Flussi	Fonti di reddito multiple, strategia di portfolio	Settimane 15-16

Il Modulo R (Motori di Guadagno) è dove si guadagna la maggior parte dei soldi. Ma senza S e T, stai costruendo sulla sabbia.

Pronto per il playbook completo?

Hai visto le fondamenta. Le hai costruite tu stesso. Ora ottieni il sistema completo.

Ottieni STREETS Core — il corso completo di 16 settimane con tutti e sette i moduli, template di codice per motori di guadagno, dashboard finanziarie e la community privata di sviluppatori che costruiscono reddito alle proprie condizioni.