L'argomento verrà più ampiamente trattato nel libro in progress, e in cui già potete trovare alcuni argomenti di base (compreso l'esempio di Twitter usato nel testo) https://www.agnesevardanega.eu/books/analisi-testuale-2021/index.html
www.agnesevardanega.eu
Strumenti per l’analisi testuale e il text mining con R
Testo dedicato ai principali strumenti disponibili in R per l’analisi testuale e il text mining. Esempi in italiano, e repertorio delle risorse aperte per la lingua italiana.
Avviso ai naviganti: se mi scrivete dal sito senza aver fatto l’accesso all’account Facebook, e non rispondo entro le 24h, la chat si cancella e non potrete vedere le risposte. Se non avete un account Facebook, o non volete usarlo, scrivete qui (nella chat) o mandate una mail.
👍1
A novembre torna il Laboratorio di analisi dei dati con R, presso l'Università di Teramo, in modalità mista. Le date sono 10 novembre, 1 dicembre, 15 dicembre, 18 gennaio, dalle 15 alle 19. Questo è il link per l'iscrizione come uditori esterni (con attestato di partecipazione su richiesta): https://bit.ly/45CD7aE
👍4❤1
Laboratorio di analisi dei dati con R 2025. Ciao a tutti! dopo lunga sparizione, torno per proporre il consueto corso introduttivo a R, che svolgo in modalità mista presso l'Università di Teramo. Quest'anno, useremo (volendo) gli strumenti IA per il coding.
Le date sono 11 aprile, 16 maggio, 30 maggio, 6 giugno, dalle 15 alle 19. Questo è il link per l'iscrizione come uditori esterni (con attestato di partecipazione su richiesta) https://forms.gle/Lu7gWM7UFe4iQE6L8
Le date sono 11 aprile, 16 maggio, 30 maggio, 6 giugno, dalle 15 alle 19. Questo è il link per l'iscrizione come uditori esterni (con attestato di partecipazione su richiesta) https://forms.gle/Lu7gWM7UFe4iQE6L8
Google Docs
Laboratorio di analisi dei dati con R 2024/25
Le informazioni richieste in questo modulo servono per organizzare il laboratorio (accesso ai materiali, registri di presenza, diffusione delle registrazioni delle lezioni, ecc.)
👍5
Ricerca Sociale con R pinned «Laboratorio di analisi dei dati con R 2025. Ciao a tutti! dopo lunga sparizione, torno per proporre il consueto corso introduttivo a R, che svolgo in modalità mista presso l'Università di Teramo. Quest'anno, useremo (volendo) gli strumenti IA per il coding.…»
Ciao a tutt*! Dopo l'ennesima lunga pausa, torno con tante novità!
🛜 Il sito è ospitato su un server più performante, e ho dato una rinfrescata al look. Ci sono ancora piccoli lavori in corso, ma dovrebbe funzionare tutto. Se riscontrate problemi, fatemi sapere, scrivendo qui o usando il nuovo widget della chat, che ora avvia la chat di Telegram (personale) o la mail
🔐 E questo perché ho lavorato per garantire la massima tutela della privacy: solo cookie tecnici per chi è iscritto, e nessun tracciamento. Tutti i file da scaricare sono disponibili direttamente dal server o tramite Proton Drive.
La nuova informativa sulla privacy è online per chi vuole approfondire.
📚 Infine, ho inaugurato una nuova sezione, Scrittura accademica & oltre, dedicata alla scrittura scientifica con R Markdown e Quarto. Se vi interessa integrare codice e testo, per scrivere la tesi, un articolo, o per esportare i risultati, visitatela, e fatemi sapere cosa vi piacerebbe approfondire.
A presto!
🛜 Il sito è ospitato su un server più performante, e ho dato una rinfrescata al look. Ci sono ancora piccoli lavori in corso, ma dovrebbe funzionare tutto. Se riscontrate problemi, fatemi sapere, scrivendo qui o usando il nuovo widget della chat, che ora avvia la chat di Telegram (personale) o la mail
🔐 E questo perché ho lavorato per garantire la massima tutela della privacy: solo cookie tecnici per chi è iscritto, e nessun tracciamento. Tutti i file da scaricare sono disponibili direttamente dal server o tramite Proton Drive.
La nuova informativa sulla privacy è online per chi vuole approfondire.
📚 Infine, ho inaugurato una nuova sezione, Scrittura accademica & oltre, dedicata alla scrittura scientifica con R Markdown e Quarto. Se vi interessa integrare codice e testo, per scrivere la tesi, un articolo, o per esportare i risultati, visitatela, e fatemi sapere cosa vi piacerebbe approfondire.
A presto!
❤9
Ricerca Sociale con R pinned «Ciao a tutt*! Dopo l'ennesima lunga pausa, torno con tante novità! 🛜 Il sito è ospitato su un server più performante, e ho dato una rinfrescata al look. Ci sono ancora piccoli lavori in corso, ma dovrebbe funzionare tutto. Se riscontrate problemi, fatemi…»
Due sono i motivi per cui aggiungo una nuova voce alla wiki
1️⃣ Il primo è che mi serve materiale da usare a lezione e lasciare agli studenti (le voci si possono scaricare in PDF).
2️⃣ Il secondo... è che ci sono funzioni comodissime, come
Questa funzione è super-comoda per sostituire valori mancanti, unire informazioni frammentate, correggere i dati (con un join).
📚 La trovate qui: coalesce (dplyr)
✍️ Se avete una funzione che dimenticate regolarmente, ma vi salva la giornata (quando la riscovate), ... aggiungetela alla wiki! Potete collaborare in tanti modi: scrivere una voce, segnalare / correggere un errore, o chiedere l’inserimento di un termine che manca.
A presto!
1️⃣ Il primo è che mi serve materiale da usare a lezione e lasciare agli studenti (le voci si possono scaricare in PDF).
2️⃣ Il secondo... è che ci sono funzioni comodissime, come
coalesce(), di cui non ricordo mai né l’esistenza né l’uso. Sempre sperando che, quando mi servono, mi venga in mente di cercarle 😅Questa funzione è super-comoda per sostituire valori mancanti, unire informazioni frammentate, correggere i dati (con un join).
📚 La trovate qui: coalesce (dplyr)
✍️ Se avete una funzione che dimenticate regolarmente, ma vi salva la giornata (quando la riscovate), ... aggiungetela alla wiki! Potete collaborare in tanti modi: scrivere una voce, segnalare / correggere un errore, o chiedere l’inserimento di un termine che manca.
A presto!
👍2
Ciao! Oggi mini-recensione di Positron, il nuovo IDE di Posit.
Costruito su VS Code, ha i pannelli e gli strumenti di RStudio.
Rispetto a VS Code
📊 Troviamo i pannelli dei grafici, oggetti, help e un visualizzatore di dati potenziato (si vede nell'immagine).
💡 R, Python, Jupyter e Quarto sono integrati e non richiedono di intallazioni aggiuntive.
Rispetto a RStudio
✍🏼 Quarto diventa lo strumento principale per la scrittura dei report, come Jupyter per i notebook (e con kernel R 🎉). RMarkdown è comunque supportato.
⌨️ Più tastiera. Bisogna abituarsi alla "palette dei comandi", che sostituisce molti menu e bottoni.
🤖 Assistenti AI. Da poco c'è un Positron Assistant, che integra profondamente i modelli: al momento GitHub Copilot e Claude per la chat.
🔌In ogni caso, con le estensioni di VS Code, la scelta di integrazioni AI non manca.
💬 Qualcuno di voi lo ha provato? Raccontate!
A presto!
Costruito su VS Code, ha i pannelli e gli strumenti di RStudio.
Rispetto a VS Code
📊 Troviamo i pannelli dei grafici, oggetti, help e un visualizzatore di dati potenziato (si vede nell'immagine).
💡 R, Python, Jupyter e Quarto sono integrati e non richiedono di intallazioni aggiuntive.
Rispetto a RStudio
✍🏼 Quarto diventa lo strumento principale per la scrittura dei report, come Jupyter per i notebook (e con kernel R 🎉). RMarkdown è comunque supportato.
⌨️ Più tastiera. Bisogna abituarsi alla "palette dei comandi", che sostituisce molti menu e bottoni.
🤖 Assistenti AI. Da poco c'è un Positron Assistant, che integra profondamente i modelli: al momento GitHub Copilot e Claude per la chat.
🔌In ogni caso, con le estensioni di VS Code, la scelta di integrazioni AI non manca.
💬 Qualcuno di voi lo ha provato? Raccontate!
A presto!
👏2❤1
Mentre aggiorno wiki e materiali del corso anche in vista dell'uso di Positron accanto a RStudio, approfitto delle estensioni per passare a Marp nella creazione delle slides.
Da RMarkdown (o Quarto) creo il file markdown con l'output, e poi lo sistemo (poco) per passarlo in Marp.
🧩 Nello screenshot, ho evidenziato le integrazioni: a sinistra, il pulsante delle estensioni per installarlo, nella barra il pulsante di Marp per generare l'html, e ... il file css per la personalizzazione del tema, che appare nella preview.
🎨 Ho scelto l'azzurro R come colore di accento. La grafica non fa per me, prendo la scusa del minimalismo e via.
1/2
Da RMarkdown (o Quarto) creo il file markdown con l'output, e poi lo sistemo (poco) per passarlo in Marp.
🧩 Nello screenshot, ho evidenziato le integrazioni: a sinistra, il pulsante delle estensioni per installarlo, nella barra il pulsante di Marp per generare l'html, e ... il file css per la personalizzazione del tema, che appare nella preview.
🎨 Ho scelto l'azzurro R come colore di accento. La grafica non fa per me, prendo la scusa del minimalismo e via.
1/2
👍2
2/2
🧩 Less is more. In linea di massima, è facile creare delle slides da markdown con Pandoc, ovvero il sistema a cui si appoggiano RStudio e tanti altri software per la conversione dei formati. Il complicato è avere delle slides decenti. Il trucco è il minimalismo.
🌐 RMarkdown e Quarto supportano svariati formati, ma per l'html minimalista Marp secondo me non si batte.
Qui vedete il mio template: un file senza personalizzazioni (tema di default), con una slide per tipo di effetto, che mi serve a non cercare la documentazione in giro. (La wiki è nata così)
Qualcuno fa i report in forma di presentazione? Anche questi appunti che condivido qui finiranno nella sezione scrittura accademica: fatemi sapere che ne pensate.
🧩 Less is more. In linea di massima, è facile creare delle slides da markdown con Pandoc, ovvero il sistema a cui si appoggiano RStudio e tanti altri software per la conversione dei formati. Il complicato è avere delle slides decenti. Il trucco è il minimalismo.
🌐 RMarkdown e Quarto supportano svariati formati, ma per l'html minimalista Marp secondo me non si batte.
Qui vedete il mio template: un file senza personalizzazioni (tema di default), con una slide per tipo di effetto, che mi serve a non cercare la documentazione in giro. (La wiki è nata così)
Qualcuno fa i report in forma di presentazione? Anche questi appunti che condivido qui finiranno nella sezione scrittura accademica: fatemi sapere che ne pensate.
👍1
Un'altra anteprima sui contenuti che sto preparando per la wiki: Gli strumenti CLI.
🤖 Ho aggiornato la voce su R e gli strumenti IA, specie nella parte relativa all'uso programmatico.
🖥️ Nel frattempo. però, sono usciti i Command-Line Interface tools (CLI) di Gemini e di OpenAi: conversazionali, ma ancorati al contesto del progetto (la cartella), e in grado di interagire con esso, sia in lettura che in scrittura.
Per provare, consiglio Gemini CLI perché ha limiti gratuiti molto ampi: 60 richieste al minuto e 1.000 al giorno, accedendo con l'account personale (anche se usa l'API).
In VS Code / Positron trovate l'estensione Gemini CLI companion che permette al modello di compiere azioni nell'IDE.
Nello screenshot vedete uno script modificato in modalità "diff", evidenziando cioè errori e suggerimenti di correzioni, che l'utente può accettare o rifiutare, così come fanno anche gli assistenti integrati (in modalità agentiva).
Poiché funziona da terminale, può essere usato anche in RStudio (segue)
🤖 Ho aggiornato la voce su R e gli strumenti IA, specie nella parte relativa all'uso programmatico.
🖥️ Nel frattempo. però, sono usciti i Command-Line Interface tools (CLI) di Gemini e di OpenAi: conversazionali, ma ancorati al contesto del progetto (la cartella), e in grado di interagire con esso, sia in lettura che in scrittura.
Per provare, consiglio Gemini CLI perché ha limiti gratuiti molto ampi: 60 richieste al minuto e 1.000 al giorno, accedendo con l'account personale (anche se usa l'API).
In VS Code / Positron trovate l'estensione Gemini CLI companion che permette al modello di compiere azioni nell'IDE.
Nello screenshot vedete uno script modificato in modalità "diff", evidenziando cioè errori e suggerimenti di correzioni, che l'utente può accettare o rifiutare, così come fanno anche gli assistenti integrati (in modalità agentiva).
Poiché funziona da terminale, può essere usato anche in RStudio (segue)
Questa è l'integrazione in RStudio. A noi anzian* fa venire voglia di far partire "Prince of Persia"
🤖 Scherzi a parte, si tratta di un modo per usare un assistente in RStudio, visto che al momento è disponibile solo GitHub Copilot Pro.
🔧 Come si fa:
- installare, se necessario, nodejs seguendo le istruzioni a schermo;
- da terminale (👻) installare l'assistente:
- in Windows, sempre nel terminale, autorizzare l'esecuzione degli script locali:
- aprire il terminale nella cartella del progetto, o usare quello di RStudio, e digitare
Nell'analisi dei dati, questi assistenti sono utili in quanto oltre a rispondere nella chat, sono in grado di valutare la struttura del progetto, trovare i file inutili, cioè non richiamati negli script principali, migliorare la documentazione, ecc.
Che ve ne pare? Troppo complicato? Un pochino all'inizio, ma quando è installato, è piuttosto accessibile.
🤖 Scherzi a parte, si tratta di un modo per usare un assistente in RStudio, visto che al momento è disponibile solo GitHub Copilot Pro.
🔧 Come si fa:
- installare, se necessario, nodejs seguendo le istruzioni a schermo;
- da terminale (👻) installare l'assistente:
npm install -g @google/gemini-cli- in Windows, sempre nel terminale, autorizzare l'esecuzione degli script locali:
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser- aprire il terminale nella cartella del progetto, o usare quello di RStudio, e digitare
geminiNell'analisi dei dati, questi assistenti sono utili in quanto oltre a rispondere nella chat, sono in grado di valutare la struttura del progetto, trovare i file inutili, cioè non richiamati negli script principali, migliorare la documentazione, ecc.
Che ve ne pare? Troppo complicato? Un pochino all'inizio, ma quando è installato, è piuttosto accessibile.
🔏 Nella ricerca di soluzioni privacy-friendly, ho trovato una soluzione anche per i video.
📺 Il nuovo canale sarà ospitato da GARR.tv, una istanza PeerTube gestita dal Consortium GARR, la rete italiana per l'Istruzione e la ricerca.
🎞️Per il momento sto estraendo "pillole" tratte dai vecchi video, in una playlist di introduzione a RStudio.
Il formato però resterà quello: brevi video dedicati a quello che "si fa prima a fare che a dire", organizzati in playlist.
https://garr.tv/c/1f31d257_a6d9_4138_a0e9_8a53928c983e_channel/videos
📺 Il nuovo canale sarà ospitato da GARR.tv, una istanza PeerTube gestita dal Consortium GARR, la rete italiana per l'Istruzione e la ricerca.
🎞️Per il momento sto estraendo "pillole" tratte dai vecchi video, in una playlist di introduzione a RStudio.
Il formato però resterà quello: brevi video dedicati a quello che "si fa prima a fare che a dire", organizzati in playlist.
https://garr.tv/c/1f31d257_a6d9_4138_a0e9_8a53928c983e_channel/videos
GARR.tv
Analisi dei dati con R
Canale del Laboratorio di analisi dei dati con R. Tutorial sull'uso di R per l'analisi dei dati nella ricerca sociale e politica. Wiki con i materiali all'indirizzo: https://www.agnesevardanega.eu/...
👍3
📈 Torna il Laboratorio di analisi dei dati con R, a partire dal 13 marzo.
Si tratta di 4 incontri in modalità mista da 4 ore, distanziati l'uno dall'altro di 3-4 settimane, in cui impareremo a conoscere RStudio e Positron, gli assistenti al codice, e naturalmente le basi del linguaggio di R. Verrà rilasciato un attestato di partecipazione.
📄Trovate il programma a questo link. Per iscrivervi da esterni (uditori), usate invece questo modulo.
A presto!
Si tratta di 4 incontri in modalità mista da 4 ore, distanziati l'uno dall'altro di 3-4 settimane, in cui impareremo a conoscere RStudio e Positron, gli assistenti al codice, e naturalmente le basi del linguaggio di R. Verrà rilasciato un attestato di partecipazione.
📄Trovate il programma a questo link. Per iscrivervi da esterni (uditori), usate invece questo modulo.
A presto!
Ricerca Sociale con R
Laboratorio di analisi dei dati con R
Laboratorio di analisi dei dati con R Il Laboratorio di analisi dei dati con R inizierà il 13 marzo, sarà svolto in forma mista, e aperto come sempre agli uditori. Obiettivo è quello di far acquisire le competenze fondamentali nell'analisi dei dati con…
Ricerca Sociale con R pinned «📈 Torna il Laboratorio di analisi dei dati con R, a partire dal 13 marzo. Si tratta di 4 incontri in modalità mista da 4 ore, distanziati l'uno dall'altro di 3-4 settimane, in cui impareremo a conoscere RStudio e Positron, gli assistenti al codice, e naturalmente…»
🏅È ufficialmente attivo il nuovo OpenBadge "R per l'analisi dei dati - Livello base", rilasciato al termine del Laboratorio di Analisi dei dati con R, come certificazione digitale delle competenze acquisite.
📄 Vi ricordo il programma del Laboratorio a questo link, e il modulo per l'iscrizione da esterni (uditori). Le attività si svolgeranno in modalità mista, a partire dal 13 marzo. Per info, non esitate a contattarmi
📄 Vi ricordo il programma del Laboratorio a questo link, e il modulo per l'iscrizione da esterni (uditori). Le attività si svolgeranno in modalità mista, a partire dal 13 marzo. Per info, non esitate a contattarmi
✨ È finalmente disponibile la versione interamente rinnovata di sentixr, il pacchetto R per l’analisi del sentiment in italiano.
Dopo mesi di lavoro con un gruppo fantastico, abbiamo rilasciato un toolkit che integra quattro lessici (Sentix, MAL, ELIta VAD e basic emotions) e offre funzioni complete per annotare e sintetizzare testi in modo trasparente e riproducibile.
Il perché di un pacchetto dedicato è presto detto: mettere a disposizione della comunità uno strumento aperto e ben documentato per lavorare con i lessici attualmente disponibili, facilitando sia analisi autonome che l'integrazione nei workflow di tidytext e quanteda.
🔗 Tutte le istruzioni nella pagina di presentazione del Repository GitHub: github.com/valeriobasile/sentixR
Dopo mesi di lavoro con un gruppo fantastico, abbiamo rilasciato un toolkit che integra quattro lessici (Sentix, MAL, ELIta VAD e basic emotions) e offre funzioni complete per annotare e sintetizzare testi in modo trasparente e riproducibile.
Il perché di un pacchetto dedicato è presto detto: mettere a disposizione della comunità uno strumento aperto e ben documentato per lavorare con i lessici attualmente disponibili, facilitando sia analisi autonome che l'integrazione nei workflow di tidytext e quanteda.
🔗 Tutte le istruzioni nella pagina di presentazione del Repository GitHub: github.com/valeriobasile/sentixR
GitHub
GitHub - valeriobasile/sentixR: R package to perform sentiment analysis on Italian using sentix
R package to perform sentiment analysis on Italian using sentix - valeriobasile/sentixR