Obsah fóra
PravidláRegistrovaťPrihlásenie




Odpovedať na tému [ Príspevkov: 4 ] 
AutorSpráva
Offline

Užívateľ
Užívateľ
Java, vysvetlenie prikazu

Registrovaný: 27.11.08
Prihlásený: 07.02.15
Príspevky: 373
Témy: 75
Bydlisko: Veľký Krtíš...
Príspevok NapísalOffline : 14.04.2012 20:28

Zdravím, vedel by mi niekto pomôct s jednoduchym prikazom, ktory sa nachadza nižšie. Potreboval by som vedieť presne čo znamená, ďakujem
- ide o definovanie noveho prikazu numOfCategories z suboru Instances
len presne neviem čo znamena malym pisane instances a potom znova čo je new Instances instanceinputstream je funkcia ktorou sa nadefinujú vstupné data z určiteho suboru,

Kód:
Instances instances = new Instances (new InstanceInputStream ("temp-reuters/train-instances"));
int numOfCategories = instances.numOfCategories();


Za odpoveď vopred ďakujem ;)







_________________
ACER AS5738ZG-424G50MN , 15,6" WXGA TFT displej (1366x768), Acer CrystalBrite, CPU Intel Pentium dual core T4200, RAM 4096MB DDR3 , HDD 500 GB SATA (5400rpm), GPU nVidia GeForce G 105M 512MB, Gigabit LAN, WiFi 802.11n (Acer SignalUp), OS Windows 7 Ultimate x64 Sk
CP Sony Xperia T LT30p
Offline

Čestný člen
Čestný člen
Java, vysvetlenie prikazu

Registrovaný: 11.08.07
Príspevky: 4088
Témy: 34
Bydlisko: Brno
Príspevok NapísalOffline : 14.04.2012 21:01

instances malym pismom je nazov premennej, Instances velkym je nazov nejakej triedy, v dokumentacii som taku nenasiel, takze pravdepodobne to bude nejaka tvoja vlastna. Odkial si zobral ten kod?


Offline

Užívateľ
Užívateľ
Java, vysvetlenie prikazu

Registrovaný: 27.11.08
Prihlásený: 07.02.15
Príspevky: 373
Témy: 75
Bydlisko: Veľký Krtíš...
Príspevok Napísal autor témyOffline : 15.04.2012 19:49

je to z balika jbowl
Kód:
 http://sourceforge.net/projects/jbowl/

je to knižnica na spracovanie prirodzeneho jazyka
je tam definovana Instances veľkym, tam sa nachadza vnej zapisaný počet termov, kategorí a ja potrebujem vytiahnuť čislo počet dokumentov spravil som to takto:

Kód:
Instances1 statistics = (new Statistics ("temp-reuters/train-stats"));
int numOfDocuments = statistics.numOfInstances();


cele to jedine čislo je ukryte v triede org.jbowl.data.processing.Statistics;
to predošlé bolo vytiahnuté z triedy org.jbowl.data.Instances;
vypisuje mi tam malý error ale čislo už berie, chcel by som ten error odstrániť ...
konkretne hlaška: cant not find symbol
no suitable constructor found for Statistics(java.lang.String)

prečo nevieš nahodou? :/

*
nachadza sa to v triede indexTrainingSet ulozena je v examples.task

// pridané po 22 hodinách 38 minútach od posledného príspevku

prečo mi vypisuje chybu no suitable constructor????????







_________________
ACER AS5738ZG-424G50MN , 15,6" WXGA TFT displej (1366x768), Acer CrystalBrite, CPU Intel Pentium dual core T4200, RAM 4096MB DDR3 , HDD 500 GB SATA (5400rpm), GPU nVidia GeForce G 105M 512MB, Gigabit LAN, WiFi 802.11n (Acer SignalUp), OS Windows 7 Ultimate x64 Sk
CP Sony Xperia T LT30p
Offline

Užívateľ
Užívateľ
Java, vysvetlenie prikazu

Registrovaný: 27.11.08
Prihlásený: 07.02.15
Príspevky: 373
Témy: 75
Bydlisko: Veľký Krtíš...
Príspevok Napísal autor témyOffline : 24.11.2013 17:18

no mám jeden problém,
mám dve triedy, jednu na indexáciu a druhú na klasifikovanie dokumentu do tried ....
ono mi to prebehne a spracuje, lenže chcel by som zistiť ten výpis tých dokumentov a ich vzdialeností, robil som to podla algoritmu knn, v ktorom sú zaimplementované určite metriky a neviem ktorú mam vytiahnuť a ako to robit, chcel by som to uložiť, napríklad do .txt súboru, viete mi pomôct?
chyba je vtom ze ten klasifikačny model sa uloží do binarneho suboru a to ja chcem vidiet,

tu sú triedy na indexaciu> IndexTrainingSet.java

Kód:

/*
 * To change this license header, choose License Headers in Project Properties.
 * To change this template file, choose Tools | Templates
 * and open the template in the editor.
 */

package Klasifikácia;

import examples.task.Utils;
import java.io.File;
import org.jbowl.analysis.AnnotatedText;
import org.jbowl.analysis.tokens.PorterStemmer;
import org.jbowl.analysis.tokens.SimpleTokenizer;
import org.jbowl.analysis.tokens.StopFilter;
import org.jbowl.data.processing.InstanceInputStream;
import org.jbowl.data.processing.InstanceOutputStream;
import org.jbowl.data.processing.Statistics;
import org.jbowl.data.processing.TFIDFFilter;
import org.jbowl.document.processing.DocumentAnalyzer;
import org.jbowl.document.processing.DocumentIndexer;
import org.jbowl.document.xml.XMLDocumentIndexer;
import org.jbowl.process.DataTarget;
import org.jbowl.util.HashIndexedSet;
import org.jbowl.util.IndexedSet;


public class IndexTrainingSet {

    static final String TFIDF_SCHEME = "ltc";

    static DataTarget<AnnotatedText> createTextAnalyzer() {
    return new SimpleTokenizer(new StopFilter(new PorterStemmer()));
    }

    public static void main(String argv[]) throws Exception {
        if (!new File("temp").exists()) {
             new File("temp").mkdir();
            }
       
        File tmp = File.createTempFile("tmp", null);
        tmp.deleteOnExit();
       
        IndexedSet<String> terms = new HashIndexedSet<String>();                /* Vytvoria sa objekty pre indexovacie množiny termov a kategorií, do ktorých sú jednotlivé dokumenty zaradené */
        IndexedSet<String> categories = new HashIndexedSet<String>();
       
        Statistics trainStats = new Statistics(                                  /* Deklaruje sa objekt pre výstupné štatisitky. Argument funkcie instanceOutputStream je dočasny subor, ktory služi na priebežné ukladanie údajov počas idnexácie */
                new Utils.ProgressLogger(
                new InstanceOutputStream("tmp")));   
       
        XMLDocumentIndexer indexer = new XMLDocumentIndexer(                     /* Vytvorí sa indexovací objekt, vstupným parametrom je nastavenie predspracovania a jazyk. analyzi implementované v funkcíí createTextAnalyzer*/
                new DocumentAnalyzer(createTextAnalyzer(),
                new DocumentIndexer(terms, categories, trainStats)));            /* Ďaľšie vstupné parametre sú indexovacie množiny termov terms a kategérií categories a objekt trainStats pre vystupné štatistiky  */
       
        System.out.println("indexing training set:");
        //indexer.indexFile("data/times/times.xml");               /* Vykona sa samotná indexácia, z zdrojového suboru train.xml */
        // indexer.indexFile("data/MEDLINE/90.xml");
        indexer.indexFile("data/Reuters-21578 ModApte/train.xml");
        indexer.close();
       
        System.out.println("'"+TFIDF_SCHEME+"' vahovacia schema termov:");
        new InstanceInputStream("tmp").processAll(                                   /* načitanie vstupy z dočasného suboru */
                new TFIDFFilter(TFIDF_SCHEME, trainStats,                        /* Nasledne sa aplikujú alg. váhovania a normovania podľa nastavení premennej TFIDF_scheme */
                new Utils.ProgressLogger(
                new InstanceOutputStream("temp/train-instances"))));             /* Výsledná matica sa uloží v kodovanom tvare*/
       
       
       
        Utils.writeObject(trainStats,"temp/train-stats");                        /* Ukladanie štatistík */
        Utils.writeObject(terms,"temp/term-dictionary");                        /* Indexovacie množiny termov*/
        Utils.writeObject(categories,"temp/category-dictionary");                /* Indexoaice množiny kategórií*/
       
        Utils.printTermStats(trainStats, terms, "temp/term-train-stats.txt");   /* uloženie čitateľného vypisu*/
        Utils.printCategoryStats(trainStats, categories,"temp/category-train-stats.txt");
       
       
        System.out.println("Počet termov:" + trainStats.numOfTerms()); 
        System.out.println("Počet kategórií:" + trainStats.numOfCategories());
        System.out.println("Počet dokumentov celkovo:" +trainStats.numOfInstances());
       
    }
}




BuildModel.java
Kód:
package Klasifikácia;

import examples.task.Utils;
import org.jbowl.data.processing.*;
import org.jbowl.model.descriptive.LabelingModel;
import org.jbowl.model.supervised.knn.kNNSettings;
import org.jbowl.task.BuildModelTask;
import org.jbowl.task.Connection;
import org.jbowl.task.ConnectionFactory;
import org.jbowl.task.ExecutionHandler;
import org.jbowl.task.executor.TaskExecutor;
       

       
public class BuildModel {

    @SuppressWarnings("unchecked")
    public static void main(String argv[]) throws Exception {

        BuildModelTask task = new BuildModelTask();                             /* Inicializuje sa objekt task reprezentujúci úlohu vytvornia klasifikačého modelu*/

        task.setAlgorithm("org.jbowl.model.supervised.knn.kNNAlgorithm");       /* Nastaví sa algoritmus kNN*/
                                                                                //task.setBuildData(new InstanceInputStream("temp-medline/train-instances")); /* Funkcia setBuilData nastaví fyz. cestu k súboru, ktory obs. index. tren. množinu */
        task.setBuildData(new InstanceInputStream("temp-reuters/train-instances")); /* Funkcia setBuilData nastaví fyz. cestu k súboru, ktory obs. index. tren. množinu */
        task.setBuildSettings(new kNNSettings());                               /* Nastavia sa parametre algoritmu kNN*/
        //task.setModelName("temp-medline/model");                               /* Nastaví sa fyzická cesta k súboru, kde sa uloži klasifikačný model */
       // task.setModelName("temp-times/model");
         task.setModelName("temp-reuters/model");                     /* Nastaví sa fyzická cesta k súboru, kde sa uloži klasifikačný model */

        Connection conn = ConnectionFactory.createFactory().getConnection();     /* Získa sa prepojenie na vykonávací objekt*/
        ExecutionHandler handler = conn.execute(task);                          /* Iniciuje sa vykonanie úlohy na vytvorenie klasifikačného modelu*/
        handler.waitForCompletion();                                            /* Čaká sa na dokončenie tvorby klasifikačného modelu */

       
       
       
       
       
       
        TaskExecutor.shutdown();                                                 /* Vykonávací objekt sa uvoľní */
    }
}









_________________
ACER AS5738ZG-424G50MN , 15,6" WXGA TFT displej (1366x768), Acer CrystalBrite, CPU Intel Pentium dual core T4200, RAM 4096MB DDR3 , HDD 500 GB SATA (5400rpm), GPU nVidia GeForce G 105M 512MB, Gigabit LAN, WiFi 802.11n (Acer SignalUp), OS Windows 7 Ultimate x64 Sk
CP Sony Xperia T LT30p
Odpovedať na tému [ Príspevkov: 4 ] 


Podobné témy

 Témy  Odpovede  Zobrazenia  Posledný príspevok 
V tomto fóre nie sú ďalšie neprečítané témy. Prerušenie príkazu

v HTML, XHTML, XML, CSS

2

516

31.01.2009 19:21

don jebot Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. perl: spustenie prikazu so znakom %

v Perl, Python, Ruby, CGI

4

1015

23.01.2011 16:04

siginigin Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Chybové hlásenie ,,nedostatok ukladacieho priestoru pre vykonanie príkazu"

v Operačné systémy Microsoft

9

612

02.05.2020 22:25

tatko Tom Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. dobre java navody a nova tema JAVA

[ Choď na stránku:Choď na stránku: 1, 2 ]

v Assembler, C, C++, Pascal, Java

35

5416

09.03.2009 17:14

tlacitko Enter Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Rozdiel medzi Java Standard a Java EE

v Assembler, C, C++, Pascal, Java

1

832

02.04.2014 12:41

XOLOO Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Vysvetlenie

v PHP, ASP

3

443

13.08.2010 11:32

qacer Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Vysvetlenie

v Modifikácie, návody a projekty

19

4014

14.01.2011 8:31

mack0 Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Vysvetlenie

v HTML, XHTML, XML, CSS

11

798

24.09.2008 12:19

zaciatocnik Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Vysvetlenie

v PHP, ASP

9

638

22.04.2009 19:39

Ďuri Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Vysvetlenie

v Správy pre vedenie fóra

5

1093

25.05.2010 11:28

Daron Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Oneskorenie "start" príkazu

v Ostatné

1

867

25.03.2021 9:00

shiro Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Vysvetlenie importu

v Ostatné

2

266

30.01.2013 15:37

zaciatocnik Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Vysvetlenie programu

v Assembler, C, C++, Pascal, Java

11

804

23.11.2008 20:41

shiro Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Vysvetlenie bublesort

v Assembler, C, C++, Pascal, Java

2

367

10.12.2014 22:37

Misosvk Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. vysvetlenie pojmov

v Siete

1

874

19.08.2006 15:10

Harlequin Zobrazenie posledných príspevkov

V tomto fóre nie sú ďalšie neprečítané témy. Coinminer ? Vysvetlenie

v Antivíry a antispywary

5

446

14.07.2014 0:56

stopa27 Zobrazenie posledných príspevkov


Nemôžete zakladať nové témy v tomto fóre
Nemôžete odpovedať na témy v tomto fóre
Nemôžete upravovať svoje príspevky v tomto fóre
Nemôžete mazať svoje príspevky v tomto fóre

Skočiť na:  

Powered by phpBB Jarvis © 2005 - 2024 PCforum, webhosting by WebSupport, secured by GeoTrust, edited by JanoF
Ako väčšina webových stránok aj my používame cookies. Zotrvaním na webovej stránke súhlasíte, že ich môžeme používať.
Všeobecné podmienky, spracovanie osobných údajov a pravidlá fóra