| | |
| Stránka: 1 z 1
| [ Príspevkov: 4 ] | |
Autor | Správa |
---|
Registrovaný: 27.11.08 Prihlásený: 07.02.15 Príspevky: 373 Témy: 75 Bydlisko: Veľký Krtíš... |
Zdravím, vedel by mi niekto pomôct s jednoduchym prikazom, ktory sa nachadza nižšie. Potreboval by som vedieť presne čo znamená, ďakujem
- ide o definovanie noveho prikazu numOfCategories z suboru Instances
len presne neviem čo znamena malym pisane instances a potom znova čo je new Instances instanceinputstream je funkcia ktorou sa nadefinujú vstupné data z určiteho suboru,
Kód: Instances instances = new Instances (new InstanceInputStream ("temp-reuters/train-instances")); int numOfCategories = instances.numOfCategories();
Za odpoveď vopred ďakujem
_________________ ACER AS5738ZG-424G50MN , 15,6" WXGA TFT displej (1366x768), Acer CrystalBrite, CPU Intel Pentium dual core T4200, RAM 4096MB DDR3 , HDD 500 GB SATA (5400rpm), GPU nVidia GeForce G 105M 512MB, Gigabit LAN, WiFi 802.11n (Acer SignalUp), OS Windows 7 Ultimate x64 Sk CP Sony Xperia T LT30p |
|
Registrovaný: 11.08.07 Príspevky: 4088 Témy: 34 Bydlisko: Brno | Napísal Ďuri: 14.04.2012 21:01 | |
|
instances malym pismom je nazov premennej, Instances velkym je nazov nejakej triedy, v dokumentacii som taku nenasiel, takze pravdepodobne to bude nejaka tvoja vlastna. Odkial si zobral ten kod?
|
|
Registrovaný: 27.11.08 Prihlásený: 07.02.15 Príspevky: 373 Témy: 75 Bydlisko: Veľký Krtíš... | Napísal autor témy Vikinger: 15.04.2012 19:49 | |
|
je to z balika jbowl Kód: http://sourceforge.net/projects/jbowl/ je to knižnica na spracovanie prirodzeneho jazyka je tam definovana Instances veľkym, tam sa nachadza vnej zapisaný počet termov, kategorí a ja potrebujem vytiahnuť čislo počet dokumentov spravil som to takto: Kód: Instances1 statistics = (new Statistics ("temp-reuters/train-stats")); int numOfDocuments = statistics.numOfInstances();
cele to jedine čislo je ukryte v triede org.jbowl.data.processing.Statistics;
to predošlé bolo vytiahnuté z triedy org.jbowl.data.Instances;
vypisuje mi tam malý error ale čislo už berie, chcel by som ten error odstrániť ...
konkretne hlaška: cant not find symbol
no suitable constructor found for Statistics(java.lang.String)
prečo nevieš nahodou? :/
*
nachadza sa to v triede indexTrainingSet ulozena je v examples.task // pridané po 22 hodinách 38 minútach od posledného príspevkuprečo mi vypisuje chybu no suitable constructor????????
_________________ ACER AS5738ZG-424G50MN , 15,6" WXGA TFT displej (1366x768), Acer CrystalBrite, CPU Intel Pentium dual core T4200, RAM 4096MB DDR3 , HDD 500 GB SATA (5400rpm), GPU nVidia GeForce G 105M 512MB, Gigabit LAN, WiFi 802.11n (Acer SignalUp), OS Windows 7 Ultimate x64 Sk CP Sony Xperia T LT30p |
|
Registrovaný: 27.11.08 Prihlásený: 07.02.15 Príspevky: 373 Témy: 75 Bydlisko: Veľký Krtíš... | Napísal autor témy Vikinger: 24.11.2013 17:18 | |
|
no mám jeden problém, mám dve triedy, jednu na indexáciu a druhú na klasifikovanie dokumentu do tried .... ono mi to prebehne a spracuje, lenže chcel by som zistiť ten výpis tých dokumentov a ich vzdialeností, robil som to podla algoritmu knn, v ktorom sú zaimplementované určite metriky a neviem ktorú mam vytiahnuť a ako to robit, chcel by som to uložiť, napríklad do .txt súboru, viete mi pomôct? chyba je vtom ze ten klasifikačny model sa uloží do binarneho suboru a to ja chcem vidiet, tu sú triedy na indexaciu> IndexTrainingSet.java Kód: /* * To change this license header, choose License Headers in Project Properties. * To change this template file, choose Tools | Templates * and open the template in the editor. */
package Klasifikácia;
import examples.task.Utils; import java.io.File; import org.jbowl.analysis.AnnotatedText; import org.jbowl.analysis.tokens.PorterStemmer; import org.jbowl.analysis.tokens.SimpleTokenizer; import org.jbowl.analysis.tokens.StopFilter; import org.jbowl.data.processing.InstanceInputStream; import org.jbowl.data.processing.InstanceOutputStream; import org.jbowl.data.processing.Statistics; import org.jbowl.data.processing.TFIDFFilter; import org.jbowl.document.processing.DocumentAnalyzer; import org.jbowl.document.processing.DocumentIndexer; import org.jbowl.document.xml.XMLDocumentIndexer; import org.jbowl.process.DataTarget; import org.jbowl.util.HashIndexedSet; import org.jbowl.util.IndexedSet;
public class IndexTrainingSet {
static final String TFIDF_SCHEME = "ltc";
static DataTarget<AnnotatedText> createTextAnalyzer() { return new SimpleTokenizer(new StopFilter(new PorterStemmer())); }
public static void main(String argv[]) throws Exception { if (!new File("temp").exists()) { new File("temp").mkdir(); } File tmp = File.createTempFile("tmp", null); tmp.deleteOnExit(); IndexedSet<String> terms = new HashIndexedSet<String>(); /* Vytvoria sa objekty pre indexovacie množiny termov a kategorií, do ktorých sú jednotlivé dokumenty zaradené */ IndexedSet<String> categories = new HashIndexedSet<String>(); Statistics trainStats = new Statistics( /* Deklaruje sa objekt pre výstupné štatisitky. Argument funkcie instanceOutputStream je dočasny subor, ktory služi na priebežné ukladanie údajov počas idnexácie */ new Utils.ProgressLogger( new InstanceOutputStream("tmp"))); XMLDocumentIndexer indexer = new XMLDocumentIndexer( /* Vytvorí sa indexovací objekt, vstupným parametrom je nastavenie predspracovania a jazyk. analyzi implementované v funkcíí createTextAnalyzer*/ new DocumentAnalyzer(createTextAnalyzer(), new DocumentIndexer(terms, categories, trainStats))); /* Ďaľšie vstupné parametre sú indexovacie množiny termov terms a kategérií categories a objekt trainStats pre vystupné štatistiky */ System.out.println("indexing training set:"); //indexer.indexFile("data/times/times.xml"); /* Vykona sa samotná indexácia, z zdrojového suboru train.xml */ // indexer.indexFile("data/MEDLINE/90.xml"); indexer.indexFile("data/Reuters-21578 ModApte/train.xml"); indexer.close(); System.out.println("'"+TFIDF_SCHEME+"' vahovacia schema termov:"); new InstanceInputStream("tmp").processAll( /* načitanie vstupy z dočasného suboru */ new TFIDFFilter(TFIDF_SCHEME, trainStats, /* Nasledne sa aplikujú alg. váhovania a normovania podľa nastavení premennej TFIDF_scheme */ new Utils.ProgressLogger( new InstanceOutputStream("temp/train-instances")))); /* Výsledná matica sa uloží v kodovanom tvare*/ Utils.writeObject(trainStats,"temp/train-stats"); /* Ukladanie štatistík */ Utils.writeObject(terms,"temp/term-dictionary"); /* Indexovacie množiny termov*/ Utils.writeObject(categories,"temp/category-dictionary"); /* Indexoaice množiny kategórií*/ Utils.printTermStats(trainStats, terms, "temp/term-train-stats.txt"); /* uloženie čitateľného vypisu*/ Utils.printCategoryStats(trainStats, categories,"temp/category-train-stats.txt"); System.out.println("Počet termov:" + trainStats.numOfTerms()); System.out.println("Počet kategórií:" + trainStats.numOfCategories()); System.out.println("Počet dokumentov celkovo:" +trainStats.numOfInstances()); } }
BuildModel.java Kód: package Klasifikácia;
import examples.task.Utils; import org.jbowl.data.processing.*; import org.jbowl.model.descriptive.LabelingModel; import org.jbowl.model.supervised.knn.kNNSettings; import org.jbowl.task.BuildModelTask; import org.jbowl.task.Connection; import org.jbowl.task.ConnectionFactory; import org.jbowl.task.ExecutionHandler; import org.jbowl.task.executor.TaskExecutor;
public class BuildModel {
@SuppressWarnings("unchecked") public static void main(String argv[]) throws Exception {
BuildModelTask task = new BuildModelTask(); /* Inicializuje sa objekt task reprezentujúci úlohu vytvornia klasifikačého modelu*/
task.setAlgorithm("org.jbowl.model.supervised.knn.kNNAlgorithm"); /* Nastaví sa algoritmus kNN*/ //task.setBuildData(new InstanceInputStream("temp-medline/train-instances")); /* Funkcia setBuilData nastaví fyz. cestu k súboru, ktory obs. index. tren. množinu */ task.setBuildData(new InstanceInputStream("temp-reuters/train-instances")); /* Funkcia setBuilData nastaví fyz. cestu k súboru, ktory obs. index. tren. množinu */ task.setBuildSettings(new kNNSettings()); /* Nastavia sa parametre algoritmu kNN*/ //task.setModelName("temp-medline/model"); /* Nastaví sa fyzická cesta k súboru, kde sa uloži klasifikačný model */ // task.setModelName("temp-times/model"); task.setModelName("temp-reuters/model"); /* Nastaví sa fyzická cesta k súboru, kde sa uloži klasifikačný model */
Connection conn = ConnectionFactory.createFactory().getConnection(); /* Získa sa prepojenie na vykonávací objekt*/ ExecutionHandler handler = conn.execute(task); /* Iniciuje sa vykonanie úlohy na vytvorenie klasifikačného modelu*/ handler.waitForCompletion(); /* Čaká sa na dokončenie tvorby klasifikačného modelu */
TaskExecutor.shutdown(); /* Vykonávací objekt sa uvoľní */ } }
_________________ ACER AS5738ZG-424G50MN , 15,6" WXGA TFT displej (1366x768), Acer CrystalBrite, CPU Intel Pentium dual core T4200, RAM 4096MB DDR3 , HDD 500 GB SATA (5400rpm), GPU nVidia GeForce G 105M 512MB, Gigabit LAN, WiFi 802.11n (Acer SignalUp), OS Windows 7 Ultimate x64 Sk CP Sony Xperia T LT30p |
|
| Stránka: 1 z 1
| [ Príspevkov: 4 ] | |
Podobné témy | Témy | Odpovede | Zobrazenia | Posledný príspevok |
---|
| Prerušenie príkazu v HTML, XHTML, XML, CSS | 2 | 516 | 31.01.2009 19:21 don jebot | | perl: spustenie prikazu so znakom % v Perl, Python, Ruby, CGI | 4 | 1015 | 23.01.2011 16:04 siginigin | | Chybové hlásenie ,,nedostatok ukladacieho priestoru pre vykonanie príkazu" v Operačné systémy Microsoft | 9 | 612 | 02.05.2020 22:25 tatko Tom | | dobre java navody a nova tema JAVA [ Choď na stránku: 1, 2 ] v Assembler, C, C++, Pascal, Java | 35 | 5416 | 09.03.2009 17:14 tlacitko Enter | | Rozdiel medzi Java Standard a Java EE v Assembler, C, C++, Pascal, Java | 1 | 832 | 02.04.2014 12:41 XOLOO | | Vysvetlenie v PHP, ASP | 3 | 443 | 13.08.2010 11:32 qacer | | Vysvetlenie v Modifikácie, návody a projekty | 19 | 4014 | 14.01.2011 8:31 mack0 | | Vysvetlenie v HTML, XHTML, XML, CSS | 11 | 798 | 24.09.2008 12:19 zaciatocnik | | Vysvetlenie v PHP, ASP | 9 | 638 | 22.04.2009 19:39 Ďuri | | Vysvetlenie v Správy pre vedenie fóra | 5 | 1093 | 25.05.2010 11:28 Daron | | Oneskorenie "start" príkazu v Ostatné | 1 | 867 | 25.03.2021 9:00 shiro | | Vysvetlenie importu v Ostatné | 2 | 266 | 30.01.2013 15:37 zaciatocnik | | Vysvetlenie programu v Assembler, C, C++, Pascal, Java | 11 | 804 | 23.11.2008 20:41 shiro | | Vysvetlenie bublesort v Assembler, C, C++, Pascal, Java | 2 | 367 | 10.12.2014 22:37 Misosvk | | vysvetlenie pojmov v Siete | 1 | 874 | 19.08.2006 15:10 Harlequin | | Coinminer ? Vysvetlenie v Antivíry a antispywary | 5 | 446 | 14.07.2014 0:56 stopa27 |
| Nemôžete zakladať nové témy v tomto fóre Nemôžete odpovedať na témy v tomto fóre Nemôžete upravovať svoje príspevky v tomto fóre Nemôžete mazať svoje príspevky v tomto fóre
|
|