Spaces:
Runtime error
Runtime error
configured classifier so taht three topics are classified. Also added timer for while-loop
Browse files- .idea/misc.xml +1 -1
- .idea/politweet.iml +1 -1
- data/twitterdata.csv +0 -59
- textclassifier/TextClassifier.py +11 -8
.idea/misc.xml
CHANGED
@@ -1,4 +1,4 @@
|
|
1 |
<?xml version="1.0" encoding="UTF-8"?>
|
2 |
<project version="4">
|
3 |
-
<component name="ProjectRootManager" version="2" project-jdk-name="Python 3.
|
4 |
</project>
|
|
|
1 |
<?xml version="1.0" encoding="UTF-8"?>
|
2 |
<project version="4">
|
3 |
+
<component name="ProjectRootManager" version="2" project-jdk-name="Python 3.9 (politweet)" project-jdk-type="Python SDK" />
|
4 |
</project>
|
.idea/politweet.iml
CHANGED
@@ -5,7 +5,7 @@
|
|
5 |
<excludeFolder url="file://$MODULE_DIR$/politweet-environment" />
|
6 |
<excludeFolder url="file://$MODULE_DIR$/env" />
|
7 |
</content>
|
8 |
-
<orderEntry type="
|
9 |
<orderEntry type="sourceFolder" forTests="false" />
|
10 |
</component>
|
11 |
<component name="PyNamespacePackagesService">
|
|
|
5 |
<excludeFolder url="file://$MODULE_DIR$/politweet-environment" />
|
6 |
<excludeFolder url="file://$MODULE_DIR$/env" />
|
7 |
</content>
|
8 |
+
<orderEntry type="jdk" jdkName="Python 3.9 (politweet)" jdkType="Python SDK" />
|
9 |
<orderEntry type="sourceFolder" forTests="false" />
|
10 |
</component>
|
11 |
<component name="PyNamespacePackagesService">
|
data/twitterdata.csv
DELETED
@@ -1,59 +0,0 @@
|
|
1 |
-
id,tweet,date,user_id,username,urls,nlikes,nreplies,nretweets,topic,sentiment
|
2 |
-
1222901543231344640,Poddintervju med Samtidigt-gänget! Finns där poddar finns osv. ☕ https://t.co/wC7UriRrWE,2020-01-30 16:17:02,95972673,jimmieakesson,[],103,4,8, podcasts,praise
|
3 |
-
1222426025877016576,"""Prata inte om medkänsla. Ni valde att prioritera 9 000 vuxna afghanska män som saknar skäl att stanna i Sverige"" https://t.co/Lqlg7mA1eL",2020-01-29 08:47:30,95972673,jimmieakesson,['https://nyheteridag.se/jimmie-akesson-till-morgan-johansson-om-inte-du-har-upptackt-det-sa-ar-sverige-fullt/'],1784,69,227,politics,criticism
|
4 |
-
1222133730757824514,Sett till det läge Sverige befinner sig i – där vi knappt klarar av att upprätthålla en välfungerande välfärd för våra egna medborgare – menar vi att det är direkt oansvarigt att vilja öka mottagandet av kvotflyktingar. https://t.co/JelLbX3Oe8,2020-01-28 13:26:02,95972673,jimmieakesson,['https://www.svd.se/lat-kommunerna-besluta-nivan-for-kvotflyktingar'],1505,81,222,politics,opposition
|
5 |
-
1221790690692272129,"Idag är det förintelsens minnesdag och 75 år sedan befrielsen av Auschwitz. Låt oss hedra offren och aldrig glömma de fasor som antisemitismen har orsakat. Vi får heller aldrig acceptera den antisemitism som finns idag, oavsett extremistisk utgångspunkt.",2020-01-27 14:42:55,95972673,jimmieakesson,[],3088,171,268,holocaust memorial day,remembrance
|
6 |
-
1220308369778651136,Det är varje oppositionspartis ansvar att minimera skadorna som regeringen Löfven åsamkar Sverige och detta är ett viktigt agerande i den riktningen. Välfärden är en absolut central del av det svenska folkhemsbygget och måste prioriteras.,2020-01-23 12:32:42,95972673,jimmieakesson,[],1709,61,182,politics,opposition
|
7 |
-
1217404594726281216, https://t.co/AdqzHLMHoW,2020-01-15 12:14:08,95972673,jimmieakesson,[],732,19,97, twitter,questions
|
8 |
-
1217371452044955648,#pldebatt https://t.co/FQ6pTT0rPk,2020-01-15 10:02:26,95972673,jimmieakesson,[],548,5,76, politics,statements
|
9 |
-
1217354299145170944,Klockan 09:00 startar årets första partiledardebatt i riksdagen. Se den på lämplig kanal! https://t.co/PzrlR3Vvyd,2020-01-15 08:54:16,95972673,jimmieakesson,[],588,17,32,politics,statements
|
10 |
-
1216971561497964550,"Stefan Löfven och @socialdemokrat är återigen Miljöpartiets marionetter när det kommer till viktiga politiska frågor. Detta trots att två av tre svenskar vill behålla kärnkraften, inklusive Socialdemokraternas egna väljare. https://t.co/L4p8yHgykl",2020-01-14 07:33:25,95972673,jimmieakesson,['https://www.dn.se/debatt/sd-leder-oppositionen-i-ett-forsok-att-radda-ringhals/'],1138,27,158,politics,criticism
|
11 |
-
1215952175463108608,SD har förberett för nyval sedan den nygamla Löfvenregeringen tillträdde för ett år sedan. Vi står redo!,2020-01-11 12:02:44,95972673,jimmieakesson,[],856,42,71,politics,support
|
12 |
-
1215952136258887680,Menar Vänstern allvar eller ska detta betraktas som mer av substanslöst vapenskrammel? Uppenbart är att väljarna inte är till freds med nuvarande situation. Regeringen såväl som Januariavtalet saknar stöd. Det vore orimligt att låta läget vara oförändrat i ytterligare tre år. https://t.co/4Jy5gxufrb,2020-01-11 12:02:35,95972673,jimmieakesson,[],1200,74,147,politics,criticism
|
13 |
-
1231333740561018880,Sverige är fantastiskt 😎 https://t.co/117HPmHRkt,2020-02-22 22:43:35,95972673,jimmieakesson,[],1588,117,250, travel,praise
|
14 |
-
1231132345593409536,"Vi ser nu hur attackerna mot unga avlöser varandra. 2019 anmäldes cirka 2 500 personrån mot barn, det är mer än dubbelt så många jämfört med 2016. Inte minst den etniskt grundade dimensionen har förstärkts i takt med aty invandringen ökat. https://t.co/SqHFBQX4Pu",2020-02-22 09:23:19,95972673,jimmieakesson,['https://www.svd.se/sd-vi-satter-brottsoffer-framfor-brottslingar'],1171,65,161,politics,criticism
|
15 |
-
1230439550327181312,"Deras 120 mandat räcker inte för att ""köra över regeringen"", och i ärlighetens namn är dessa förslag knappast att betrakta som en överkörning. Vi kommer såklart att diskutera hur vi ska ställa oss till detta initiativ, men jag hade faktiskt hoppats på mycket mer.",2020-02-20 11:30:23,95972673,jimmieakesson,[],308,15,21,politics,skepticism
|
16 |
-
1230439492122816513,"M, KD och V har kommit överens om arbetskraftsinvandringen. Förslagen verkar rimliga, men tyvärr lyckas man inte komma överens om skarpa förslag som stoppar fortsatt invandring av okvalificerad arbetskraft. https://t.co/oXqxhQDP5R",2020-02-20 11:30:10,95972673,jimmieakesson,[],449,22,48,politics,disagreement
|
17 |
-
1229716232405995521,Slutsats: Splittringspolitiken och framväxten av parallella samhällen måste stoppas. Omedelbart!,2020-02-18 11:36:11,95972673,jimmieakesson,[],584,20,51,politics,opposition
|
18 |
-
1229716187124305921,"Det är främst ""gamla"" integrationsproblem som ligger bakom den gängkriminalitet vi ser idag. Givet det faktum att den ansvarslösa invandringspolitiken fortsatt och integrationen knappast fungerat bättre, är det direkt obehagligt att tänka på hur läget ser ut om sisådär 20 år.",2020-02-18 11:36:00,95972673,jimmieakesson,[],617,24,54,politics,skepticism
|
19 |
-
1229716101547905024,"Inte alls förvånande, men Expressens granskning av polisens så kallade fokuslista i Operation Rimfrost ger starka skäl till oro. Den indikerar nämligen att vi ännu bara är i begynnelsen av en otäck utveckling som några av oss varnat för under lång tid.",2020-02-18 11:35:40,95972673,jimmieakesson,[],413,12,45,politics,criticism
|
20 |
-
1229716001740271616,"En alternativ rubrik skulle kunna vara: ""Samtliga utpekade gängledare har utländsk bakgrund"". Det är nämligen vad artikeln säger. https://t.co/wqYRemT5k5",2020-02-18 11:35:16,95972673,jimmieakesson,[],1976,91,304,politics,criticism
|
21 |
-
1228024052637405192,"Det här är faktiskt sanslöst. Episkt uselt. ""Inga skattesänkningar"" är Löfvens ständiga universallösning. På allt. 🤬 https://t.co/OgKINkrCax",2020-02-13 19:32:04,95972673,jimmieakesson,[],1276,54,146,politics,criticism
|
22 |
-
1227959140779282432,"Ponera att situationen vore den omvända, att en ensam invandrarpojke rånas, förnedras och kallas exempelvis ""jävla s***tskalle"" av ett gäng svenska grabbar. Skulle Per Bolund svara på samma sätt? Tillåt mig tvivla...",2020-02-13 15:14:08,95972673,jimmieakesson,[],1009,27,116,politics,skepticism
|
23 |
-
1227959059476774914,"Såg nyss MP-ministern Per Bolund slå knut på sig själv under riksdagens frågestund. Så kallade förnedringsrån mot unga svenskar med uppenbart rasistiska förtecken förklaras med att ""brott är brott"" och ""svenskhet har ingen betydelse"".",2020-02-13 15:13:48,95972673,jimmieakesson,[],699,23,91,politics,criticism
|
24 |
-
1227958851858837504,Varför är det så svårt för vänsterliberalerna att erkänna förekomsten av rasism mot svenskar? Det är ett oerhört svek. https://t.co/B79W7RT0Qa,2020-02-13 15:12:59,95972673,jimmieakesson,[],1530,50,191,politics,criticism
|
25 |
-
1227902037834244096,"Upp till bevis nu @shekarabi Vari ligger rättvisan i att satsa hundratals miljarder på reformer länkade till migration, medan våra egna äldre och sjuka tvingas leva på marginalen? https://t.co/iQC96rU8TE",2020-02-13 11:27:13,95972673,jimmieakesson,['https://www.expressen.se/debatt/sag-sanningen-om-invandringsvolymen/'],1566,84,258,politics,criticism
|
26 |
-
1227837103410745344,"I vanlig ordning hamnar vi högst upp på pallen. 🥇SD (2009), 🥈M (2013), 🥉S (2020)",2020-02-13 07:09:12,95972673,jimmieakesson,[],632,17,60,sports,praise
|
27 |
-
1227837048322695170,Igår gick regeringen ut och meddelade att man vill införa möjlighet till utegångsförbud för unga som begår brott. Moderaterna kritiserar — med all rätt —regeringens saktfärdighet och påpekar att man minsann föreslog detta redan 2013. https://t.co/QVyMLuLQ2V,2020-02-13 07:08:59,95972673,jimmieakesson,[],1232,45,218,politics,criticism
|
28 |
-
1224284340458336257,"Invandring av högkvalificerad arbetskraft är bra för Sverige, men vi behöver inte fler städare och diskplockare från andra länder.",2020-02-03 11:51:47,95972673,jimmieakesson,[],372,26,28,politics,opinion
|
29 |
-
1224284254596673538,Även med de föreslagna förändringarna kommer lågkvalificerad arbetskraft att ha lätt att komma hit. Lönekravet måste sättas betydligt högre och vi behöver utreda en återgång till behovsprövning i någon form.,2020-02-03 11:51:27,95972673,jimmieakesson,[],266,7,21,politics,skepticism
|
30 |
-
1224284156961722368,"Försörjningskrav för anhöriga, högre lönekrav och stopp för s k kompetensutvisningar är förslag vi driver sedan tidigare. Men, tyvärr når Moderaterna inte i mål med detta paket.",2020-02-03 11:51:03,95972673,jimmieakesson,[],105,2,10,politics,criticism
|
31 |
-
1224284075600551937,LÅNGT FRÅN MÅLET 🤔 Moderaterna presenterade nu på förmiddagen nya förslag kring reglerna för arbetskraftsinvandring. Spontant känns flera av förslagen som steg i rätt riktning. https://t.co/XTCz8DoJPC,2020-02-03 11:50:44,95972673,jimmieakesson,[],431,12,42,politics,agreement
|
32 |
-
1236718442461437952,"Men — det här är min poäng — det är inte primärt fysisk plats som avses i min argumentation. Det begriper de flesta. Vad som har betydelse är kapacitet i vård, skola och omsorg, tillgång på bostäder, segregation, trygghet osv. Sverige ÄR fullt! ❤",2020-03-08 19:20:28,95972673,jimmieakesson,[],1822,107,205,politics,statements
|
33 |
-
1236718344587350022,Vi är dessutom många som minns när Fredrik Reinfeldt flög över Sverige och insåg att vi har hur mycket plats som helst. Det är inte svårt att dra sig till minnes ett antal mindre lyckade försök att placera asylanter i mer glesbebyggda områden i exempelvis Norrlands inland.,2020-03-08 19:20:05,95972673,jimmieakesson,[],767,17,52,politics,criticism
|
34 |
-
1236718248126828544,"På söndagsmorgonen kunde vi i TV4 höra Leif GW Persson analysera mitt påstående om att Sverige är fullt. — Möjligtvis vittnar det om att han aldrig varit i Norrlands inland, sa han. Även andra debattörer har de senaste dagarna hänvisat till att vårt land minsann är glesbefolkat. https://t.co/PzLoJj5ynl",2020-03-08 19:19:42,95972673,jimmieakesson,[],1308,105,184,politics,criticism
|
35 |
-
1235982905555460096, https://t.co/rC6SUN8z87,2020-03-06 18:37:42,95972673,jimmieakesson,['https://youtu.be/LdTsXouoxZw'],288,49,42, twitter,questions
|
36 |
-
1235978076175183872,Meddelande från Turkiet https://t.co/qqxfnngNe1,2020-03-06 18:18:31,95972673,jimmieakesson,[],1543,226,163, news,statements
|
37 |
-
1235890699855413249,Den havererade migrationspolitiken och det efterföljande flyktingkaoset 2015 har rivit upp djupa sår i det svenska samhället. https://t.co/PUYWwUT60b,2020-03-06 12:31:19,95972673,jimmieakesson,['https://www.svd.se/akesson-prioritera-nu-det-svenska-folket'],1515,120,210,politics,criticism
|
38 |
-
1235187530720587776,"""Jag tycker att det är viktigt att få en egen bild av hur det ser ut. Vi har gått runt här och pratat med många människor som frågar var de är på väg. Det är väldigt många som vill till norra Europa och man nämner Sverige och Tyskland primärt."" https://t.co/PHBDyJQrCY",2020-03-04 13:57:10,95972673,jimmieakesson,['https://www.expressen.se/nyheter/jimmie-akesson-delar-ut-flygblad-kom-inte-till-oss/'],2326,293,302,refugees,statements
|
39 |
-
1235153072873230338, https://t.co/v3c7r7iHbL,2020-03-04 11:40:15,95972673,jimmieakesson,[],2551,183,266, twitter,questions
|
40 |
-
1247802077033590791,Alla personal inom omsorgen som just nu tvekar och som är rädda för att gå till jobbet måste få en fullständig och total uppbackning. Vi har som politiker ett moraliskt ansvar att göra allt som står i vår makt för att deras mående inte kompromissas bort. https://t.co/Xm7BNmARvh,2020-04-08 10:22:52,95972673,jimmieakesson,['https://www.aftonbladet.se/debatt/a/zGJ9bv/personal-i-aldrevarden-maste-ha-munskydd'],618,41,85,politics,support
|
41 |
-
1247505179735457792,"Det får inte hända igen. Vi måste tillsammans fortsätta arbetet för att bekämpa radikala och våldsbejakande ideologier i vårt land. Det arbetet får aldrig vila och den uppgiften blir tyvärr aldrig färdig, men vi måste göra vad vi kan. Vi får aldrig glömma.",2020-04-07 14:43:07,95972673,jimmieakesson,[],510,14,32,politics,sadness
|
42 |
-
1247505144721350656,"Det sägs att tiden läker alla sår, men tre år är ingenting för de människor som mist en älskad dotter, en mor, en far, en bror, en son, en nära och älskad anhörig. Idag går mina tankar till de anhöriga som fått sina liv slagna i spillror.",2020-04-07 14:42:58,95972673,jimmieakesson,[],506,3,31,grief,sadness
|
43 |
-
1247505072260513794,"Idag är det tre år sedan Sverige drabbades av ett fruktansvärt terrordåd, då den hänsynslöse islamisten och illegale migranten Rakmat Akilov kallblodigt mördade och skadade många oskyldiga människor på Drottninggatan i Stockholm.",2020-04-07 14:42:41,95972673,jimmieakesson,[],1392,52,148,terrorism,anger
|
44 |
-
1247176105221636096,Vi är alltså beredda att fälla regeringens förslag om man inte justerar det i enlighet med våra krav. Åtgärder måste skyndsamt och med automatik underställas riksdagen.,2020-04-06 16:55:29,95972673,jimmieakesson,[],224,17,16,politics,opposition
|
45 |
-
1247132245728641026,"Regeringen behöver alltså justera sitt förslag för att få uppbackning från oss. Problemet hittills har faktiskt inte varit att regeringen velat göra för mycket för snabbt. Tvärtom, vi har efterlyst mer handlingskraft.",2020-04-06 14:01:12,95972673,jimmieakesson,[],351,16,22,politics,agreement
|
46 |
-
1247132219270889472,"Vi är beredda att tillfälligt ge regeringen verktyg till snabba, kraftfulla åtgärder för att bromsa smittan, men dessa åtgärder måste omedelbart prövas av riksdagen och enskilda som drabbas ska kunna få ersättning.",2020-04-06 14:01:06,95972673,jimmieakesson,[],738,151,58,politics,agreement
|
47 |
-
1246096685232775169,En liten del av befolkningen riskerar liv och hälsa för hundratusentals människor i vårt land. Olyckligtvis biter vare sig rekommendationer eller statsministerns uppmaningar till folkvett på denna grupp. https://t.co/yVH6awNTxN,2020-04-03 17:26:15,95972673,jimmieakesson,['https://www.expressen.se/debatt/botfall-de-utan-folkvett-som-riskerar-andras-liv/'],392,43,63,covid-19,anger
|
48 |
-
1246001066061320192,Det är uppseendeväckande att den kinesiska regimen fortsatt låter djurmarknaderna i landet bedriva sin verksamhet trots att Coronapandemin tros ha sitt ursprung där. https://t.co/Tjr1HliF4T,2020-04-03 11:06:18,95972673,jimmieakesson,['https://www.gp.se/debatt/kina-m%C3%A5ste-st%C3%A4nga-de-farliga-djurmarknaderna-omedelbart-1.26339409'],1115,124,139,politics,criticism
|
49 |
-
1245720641308971009,Vi måste helt enkelt göra mer för att skydda personalen och drastiskt minska de risker de utsätts för i sitt livsviktiga arbete. https://t.co/MmRPlz2FfB,2020-04-02 16:31:59,95972673,jimmieakesson,['https://nyheteridag.se/sd-sverige-maste-sakerstalla-tillgangen-av-skyddsutrustning-till-vardpersonalen/'],336,25,47,health,opinion
|
50 |
-
1245682623491575809,De som jobbar i vård och omsorg är några av våra absolut viktigaste samhällsbärare. Särskilt i dessa tider gör de heroiska insatser med risk för sin egen hälsa. Riskerna får inte göras större än nödvändigt och kraven får inte sänkas på grund av undermålig beredskap. https://t.co/oDN1yAubGc,2020-04-02 14:00:55,95972673,jimmieakesson,[],802,58,131, healthcare,praise
|
51 |
-
1245435675903655936,Men vi kan inte stänga ner grundläggande infrastruktur. Utgår från att regeringen agerar på dessa uppgifter.,2020-04-01 21:39:38,95972673,jimmieakesson,[],176,6,8,politics,statements
|
52 |
-
1245435645855662080,SAS meddelar att det inte bär sig ekonomiskt att bedriva inrikestrafik längre och att all flygtrafik kan komma att ställas in. BRA ställer in i två månader. Detta visar att människor tar smittan på allvar.,2020-04-01 21:39:31,95972673,jimmieakesson,[],410,13,24,transportation,disagreement
|
53 |
-
1245398836123774979,PS Lyssna på den här så känns allt lite bättre: https://t.co/s5fjMUnTDC,2020-04-01 19:13:15,95972673,jimmieakesson,['https://youtu.be/CYqG-8RP-JI'],597,31,40, music,praise
|
54 |
-
1245398798614085633,"Det är trots allt ditt jobb, att i varje situation hitta fel på såna som jag. Lena, vi tar oss genom detta tillsammans! När vi besegrat den här besten lovar jag att vara tillbaka med besked. Jag ska inte göra dig besviken.",2020-04-01 19:13:06,95972673,jimmieakesson,[],973,15,45, relationships,support
|
55 |
-
1245398669073006593,"Just nu har jag och övriga i oppositionen, av hänsyn till läget, sänkt konfliktnivån ganska mycket. Jag är säker på att du förstår, och jag är lika säker på att du istället hade skrivit en riktigt arg text om jag inte agerat på det sättet.",2020-04-01 19:12:35,95972673,jimmieakesson,[],690,5,45,politics,opposition
|
56 |
-
1245398534305861641,"Ännu är vi inte lika hårt drabbade av coronakrisen som ni där uppe, men som du vet är vi lite efter här på landet. Om du känner att detta brev inte riktigt stillar din oro, är du hjärtligt välkommen att höra av dig. Jag har alltid tid för dig.",2020-04-01 19:12:03,95972673,jimmieakesson,[],556,2,26, coronavirus,concern
|
57 |
-
1245398391707914240,"Lena, jag är medveten om att många inom ditt skrå är tämligen ointresserade av vad som sker utanför Stockholms tullar, men vi som bor här lever och frodas trots ert ointresse.",2020-04-01 19:11:29,95972673,jimmieakesson,[],637,3,31,politics,disagreement
|
58 |
-
1245398223616987145,"Att du, trots allt detta elände, ägnar mig en tanke är förstås smickrande, men just nu har vi faktiskt viktigare saker att bekymra oss om. Svaret på din fråga är: Sölvesborg.",2020-04-01 19:10:49,95972673,jimmieakesson,[],756,10,40,politics,sarcasm
|
59 |
-
1245398067911757824,"Kära Lena! Jag saknar dig också. Som du säkert har noterat (du nämner det själv i din text) befinner sig Sverige och världen i kris. Människor dör, sjukvårdssystem är överbelastade, företag slås i spillror och människor tvingas ut i arbetslöshet. https://t.co/ZnSlVhuEY8",2020-04-01 19:10:12,95972673,jimmieakesson,[],1939,93,226,covid-19,sorrow
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
textclassifier/TextClassifier.py
CHANGED
@@ -45,11 +45,15 @@ class TextClassifier:
|
|
45 |
self.user_name = user_name
|
46 |
self.ts = TwitterScraper.TwitterScraper(from_date, to_date, num_tweets)
|
47 |
# Assure that scrape_by_user actually gets num_tweets
|
|
|
|
|
48 |
while True:
|
49 |
self.df = self.ts.scrape_by_user(user_name)
|
50 |
-
if len(self.df)
|
51 |
break
|
52 |
else:
|
|
|
|
|
53 |
continue
|
54 |
# Make id as type int64
|
55 |
self.df['id'] = self.df['id'].copy().astype(int)
|
@@ -194,19 +198,18 @@ class TextClassifier:
|
|
194 |
"""
|
195 |
assert isinstance(text, str)
|
196 |
|
197 |
-
prompt_string = "Classify
|
198 |
prompt_string += text
|
199 |
-
prompt_string += "\" \
|
200 |
-
"
|
201 |
-
|
202 |
response = openai.Completion.create(
|
203 |
-
model=
|
204 |
prompt=prompt_string,
|
205 |
temperature=0,
|
206 |
max_tokens=892,
|
207 |
top_p=1,
|
208 |
frequency_penalty=0,
|
209 |
-
presence_penalty=0
|
210 |
)
|
211 |
classification_unclean = response.choices[0]['text']
|
212 |
classification_clean = self.cleanup_topic_results(classification_unclean)
|
@@ -323,5 +326,5 @@ class TextClassifier:
|
|
323 |
|
324 |
|
325 |
if __name__ == "__main__":
|
326 |
-
tc = TextClassifier(from_date="2020-
|
327 |
tc.run_main_pipeline()
|
|
|
45 |
self.user_name = user_name
|
46 |
self.ts = TwitterScraper.TwitterScraper(from_date, to_date, num_tweets)
|
47 |
# Assure that scrape_by_user actually gets num_tweets
|
48 |
+
# add timer in time-loop and stop after 10 seconds
|
49 |
+
start_time = time.time()
|
50 |
while True:
|
51 |
self.df = self.ts.scrape_by_user(user_name)
|
52 |
+
if 0 < len(self.df) <= num_tweets:
|
53 |
break
|
54 |
else:
|
55 |
+
if time.time() - start_time > 10:
|
56 |
+
raise Exception("Could not get enough tweets. Please try again. Perhaps try different time range.")
|
57 |
continue
|
58 |
# Make id as type int64
|
59 |
self.df['id'] = self.df['id'].copy().astype(int)
|
|
|
198 |
"""
|
199 |
assert isinstance(text, str)
|
200 |
|
201 |
+
prompt_string = "Classify this tweet with a general topic and two sub-topics:\n\""
|
202 |
prompt_string += text
|
203 |
+
prompt_string += "\".\nGeneral topic: \nSub topic 1: \nSub topic 2:\n. The classifications should not be " \
|
204 |
+
"more than 5 words. Numerate each topic in the output. END "
|
|
|
205 |
response = openai.Completion.create(
|
206 |
+
model="text-davinci-002",
|
207 |
prompt=prompt_string,
|
208 |
temperature=0,
|
209 |
max_tokens=892,
|
210 |
top_p=1,
|
211 |
frequency_penalty=0,
|
212 |
+
presence_penalty=0
|
213 |
)
|
214 |
classification_unclean = response.choices[0]['text']
|
215 |
classification_clean = self.cleanup_topic_results(classification_unclean)
|
|
|
326 |
|
327 |
|
328 |
if __name__ == "__main__":
|
329 |
+
tc = TextClassifier(from_date="2020-01-14", to_date="2020-01-31", user_name='jimmieakesson', num_tweets=20)
|
330 |
tc.run_main_pipeline()
|