Downloadliste

Projektbeschreibung

Sally is a tool for mapping a set of strings to a set of vectors. This mapping is referred to as embedding and allows techniques of machine learning and data mining to be applied for the analysis of string data. It can be used with data such as text documents, DNA sequences, or log files. The vector space model or bag-of-words model is used. Strings are characterized by a set of features, where each feature is associated with one dimension of the vector space. Occurrences of the features in each string are counted. Alternatively, binary or TF-IDF values can be computed. Vectors can be output in plain text, LibSVM, or Matlab format.

Systemanforderungen

Die Systemvoraussetzungen sind nicht definiert
Information regarding Project Releases and Project Resources. Note that the information here is a quote from Freecode.com page, and the downloads themselves may not be hosted on OSDN.

2012-12-28 06:46
0.8.1

Unterstützung für positionelle n-Grams mit unterschiedlichen Verschiebung wurde hinzugefügt. Mehrere kleine Fehler wurden behoben.
Support for positional n-grams with varying shift has been added. Several minor bugs have been fixed.

2012-08-30 07:25
0.8.0

Unterstützung für Stoppwörter und Frequenz Thresholding wurde hinzugefügt. Die Konfiguration wurde vereinfacht und transparenter ist. Einige Bugs wurden behoben.
Support for stop words and frequency thresholding has been added. The configuration has been simplified and is more transparent. Several bugs have been fixed.

2012-05-19 03:52
0.7.1

Die Konfiguration und das Handbuch wurden verbessert.
The configuration and manual have been improved.

2012-05-14 05:18
0.7

Unterstützung für signierte Einbettung von Zeichenfolgen wurde hinzugefügt. Mehrere kleine Fehler wurden behoben.
Support for signed embedding of strings has been added. Several minor bugs have been fixed.

2012-02-07 07:31
0.6.4

Unterstützung für positionelle und sortierte n-Grams (n-Dauerwellen) wurde hinzugefügt. Das heißt, können Sie jetzt auch extrahieren n-Grams gebunden an eine Position in Zeichenfolgen und n-Grams deren Symbole sortiert werden.
Support for positional and sorted n-grams (n-perms) has been added. That is, you can now also extract n-grams bound to a position in strings and n-grams whose symbols are sorted.

Project Resources