Skip to content

Latest commit

 

History

History

sentiment

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 

Sentimentlexikon

Filer

2 067 svenska ord med sentiment (CSV). Fördelningen är 735 negativa ord och 1 333 positiva ord.

Datastruktur

Kolumn Beskrivning Datatyp
word Ord Text
polarity Manuellt granskat om ordet är positivt (pos) eller negativt (neg) Text
strength Manuell granskad styrka på sentiment från -4 till 4 (initialt -2/2) Tal
sense Semantisk mening (se SALDO) Text
written_form ['List']
part_of_speech Adjektiv, adverb, verb etc. (av, avh, avm, ava, vb, vbn, vba, ab) Text
confidence Styrka från 0 till 1 på granskarnas säkerhet att polarity är korrekt Decimaltal
lemgram Grundform av ordet Text
lemgram_frequency Frekvens av lemgram i Gigaword korpus som stämmer överens med sense Tal
lemma_frequency Innehåller missing values kallat None Tal
example Ett eller flera exempel på ordet i sammanhang Text

Källa

  • Sentimentlexikon från Språkbanken är licensierad med CC-BY (attribution). Använd följande artikel som referens för lexikonet: Nusko, Bianka and Tahmasebi, Nina and Mogren, Olof. 2016. Building a Sentiment Lexicon for Swedish.

Se även

Källkod

Python

# Import.
import pandas as pd

def get_sentiments():
    url = "https://github.com/peterdalle/svensktext/raw/master/sentiment/sentimentlex.csv"
    return pd.read_csv(url, na_values="None", encoding="utf-8", header=0, sep=",")

# Count number of negative and positive words.
df = get_sentiments()
df["polarity"].value_counts()

R

# Import.
get_sentiments <- function() {
    url <- "https://github.com/peterdalle/svensktext/raw/master/sentiment/sentimentlex.csv"
    return(read.csv(url, na.strings="None", encoding="UTF-8", header=TRUE, sep=",", stringsAsFactors=FALSE))
}

# Count number of negative and positive words.
df <- get_sentiments()
table(df$polarity)