Discussion:
[i18n-no] Norsk - Engelsk - Norsk ordbok
Tor Harald Thorland
2006-06-20 12:35:13 UTC
Permalink
Hei,

Jeg har tenk tanken på å starte et prosjekt for å samle
ord/oversettelser fra norsk til engelsk og motsatt.
Tanken er å få laget et program ala "clue" for de som har brukt det
(er rett og slett en elektronisk ordbok) som kan dra nytte av
ordlisten som blir opprettet.

Ideen er å samle/oversette på samme måte som http://no.speling.org/
gjør idag. Prosjektet blir litt annerledes, og trenger litt annen
programvare for å kjøre, an det som er på speling....

I første omgang er jeg ute etter å lodde stemningen rundt dette, samt
å høre om det er noen som vil bidra til dette og som kanskje vet om
programvare som kan brukes.

Hvis du er interessert, og/eller vet om noe til å få sparket igang
dette, så ta kontakt.

Jeg har begynt arbeidet med å lage et eget system for dette, men tar
hva som helt opp til vurdering/diskusjon.

Hilsen
Tor Harald
Petter Reinholdtsen
2006-06-20 19:41:55 UTC
Permalink
[Tor Harald Thorland]
Post by Tor Harald Thorland
Jeg har tenk tanken på å starte et prosjekt for å samle
ord/oversettelser fra norsk til engelsk og motsatt.
Har du oppdaget <URL:http://www.dicts.info/>. Jeg tror det er
videreføringen av prosjektet der alle kunne bidra med oversettelser på
dugnad.

Jeg er enig i at dette er noe vi trenger, både for bokmål og nynorsk,
og håper noen allerede er igang som vi kan bistå med å få resten av
ordene på plass.

Vennlig hilsen,
--
Petter Reinholdtsen
Tor Harald Thorland
2006-06-21 13:18:48 UTC
Permalink
Post by Petter Reinholdtsen
[Tor Harald Thorland]
Post by Tor Harald Thorland
Jeg har tenk tanken på å starte et prosjekt for å samle
ord/oversettelser fra norsk til engelsk og motsatt.
Har du oppdaget <URL:http://www.dicts.info/>. Jeg tror det er
videreføringen av prosjektet der alle kunne bidra med oversettelser på
dugnad.
Jeg er enig i at dette er noe vi trenger, både for bokmål og nynorsk,
og håper noen allerede er igang som vi kan bistå med å få resten av
ordene på plass.
Vennlig hilsen,
Har kikket på det, og det ser ikke help åpent og fritt ut..
Se her fra deres nettsted:
Yet some licences forbid the distribution of modified dictionaries.
Because there are so many different licences and dictionaries it is
quite tricky to allow the download even of some dictionaries. We have
decided to place links to raw dictionaries on this page instead. It is
more tricky for you now to get the translations ;-). If you want to
use the dictionary you have to convert it from its original format.

Planen er også å få til et program lignende det i linken under, men
med mulighet for brukerne til sende inn ord hvis det ikke finnes (ved
hjelp av en knapp etter at de har søkt.., samt nedlasting av ordbok,
uten å måtte oppgradere en hel pakke osv..
Loading Image...

Pr. dags dato har jeg nå databaser, samt skript for å sende ut og
motta oversettelser. Disse mangler "litt" testing før de kan settes i
funksjon.

Jeg har også prøvd å få tak i freedict, og stardict idag, for å få tak
i et grunnlag som en kan oversette videre på, samt å kvalitetssikre
ordene som er der. Det ser ut til at noen av ordlistene går via andre
språk i oversettelsene og det gir ikke alltid et godt resultat.

Jeg skal holde dere underrettet om hva som skjer, og håper flere
melder seg inn i debatten :-)

Hilsen
Tor Harald
Tor Harald Thorland
2006-06-21 20:34:20 UTC
Permalink
Hei,

En liten oppdatering:

Etter flere mailer idag til dicts.info, har jeg summert opp til følgende:

- - De har brukt freedict sin ordliste for å oppdatere sin egen,og den
inneholder som de sier a few thousand words
- - De blander lister, ved hjelp av synonymer, andre språks lister
osv... Hvis en følger linken som ble sendt i den siste mailen jeg
mottok: http://xdxf.revdanica.com/down/ Hvis du velger fra engelsk,
til norsk, får du opp 2 ordlister, på disse er den en copyright, og
ved å gå til nettsiden til copyrighten, kommer du hit:
http://www.freelang.net/dictionary/norwegian.html
og som dere ser... oppdatert sist dec 2002


Det jeg er litt opptatt av rundt det hele er:
- - Å få korrekte oversettelser, og da også for forskjellige situasjoner
hvor et ord blir oversatt til f.eks. i edb sammenheng, hva det betyr i
økonomi sammenheng osv....
- - At det skal være enkelt å få inn nye ord, og at nye ord skal kunne
lastes ned daglig, siden det kan legges inn prioritering på ord som
blir rapportert inn som "manglende"
- - Ved et tilsvarende system som no.speling har man oversettere, og det
vil bli nye bilag daglig.
F.eks. 1 mann, 10 ord daglig.. 3650 ord pr. år..... så... 12 mann 1,5
måned og du har en tilsvarende liste... Det er ikke så rare insatsen.

Jeg jobber videre med å se på muligheter for å "importere"
eksisterende lister, for å øke kvaliteten på disse, samt å ha et
utgangspunkt.

Under kan dere lese mailene til dict.info. og det virket ikke som de
var så veldig lystne på noe prosjekt... og enkelte spørsmål satte jeg
litt på spissen for å få svar.
Jeg er enig i endel av argumentene hans, men synes ikke det er den
"beste" måten å lage en "korrekt" ordbok på.

Kom gjerne med inspill her.

Tor Harald

Hello

Yes we tell people not to distribute our dictionaries with their
programs because after some time the net would be full of outdated
copies of our dictionaries and we could do nothing about it. So the
best way is to make a program compatible with our notation and tell
users where they can download the newest versions - no outdated dicts
in zip files on sites all over the net.

Some users asked us to add support for dict protocol but very few
users use linux and know how to use dict protocol.

There are only few thousand Norwegian Bokmal entries in our system -
if we would have larger input dictionaries we could add much more
entries. Small input dicts -> few entries in the universal dictionary.
We did not find a single Nynorsk dictionary so we were unable to add
any Nynorsk entries. But I still do not understand why do you have two
languages. Imagine that whole USA speaks English and almost whole
South America speaks Spanish.

When I say more than 40 Norwegian dictionaries I mean more than 40
Norwegian dictionaries they are here:
http://dicts.info/dictlist1.php?l=Norwegian_Bokmal
Right now you will create another dictionary on the right side of the
page. But if you would work with us each entry you would add would
increase the amount of complex entries of all Norwegian dictionaries
on the left side of the page. Are you sure you understand
how our Universal dictionary works? If you would like to create
English-Norwegian dictionary it would be wise to add Norwegian entries
next to English synsets of wordnet thesaurus. Because if you will
write the English words again you will lose a lot of time and never
create as good entries as wordnet has.

Trust me creating a dictionary is a lot of hard work. You will see
after few days ;-)

Zdenek
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Hello,
It is not that I like your suggestion in making more
dictionaries... but there is some of my point's wich I cannot see
to work with that suggestion..
1. We cannot use it in a program for offline work/search. 2. It is
not that good proofread, so it might be more faulty. 3. The web
interface is the only way to use it.. 4. It does not cooperate with
the proofreading & building of both Norwegian Nynorsk, and The
Norwegian Bokmaal spelling lists, wich will make it possible to
make the same dictionary for both of the "languages"..
Best Regards Tor Harald Thorland
Btw. what do you mean with nearly 50 dictionaries.. out of 5
words..
We are not planning any other languages, only
Norwegian->English->Norwegian...
Hello
We use dictionaries from many sources. Many our dictionaries are
combined from more than one dictionary. We need word-word
notation
in our bilingual dictionaries so some information is lost in the
conversion of source data. I suggest using original dictionaries
instead of our modified files. We use freedict Norwegian
dictionary
and heinzelnisse.info German-Norwegian dictionary. You can get
the
dictionaries from: http://xdxf.revdanica.com/down/
http://heinzelnisse.info
But I have to say again these are "only" bilingual dictionaries
if
you would create entries like: 02064081-n -- dog; domestic dog;
Canis familiaris -- bikkje; hund we would be able to add these
entries into our system and everyone would have more than 40
Norwegian dictionaries. You would be allowed to use them all in
your projects. We have already about 6000 Norwegian entries in
the
UD but they need to be edited so they are nice. It is also much
less work editing this file then creating another bilingual
dictionary (it took me 15 months to create English-Czech
bilingual
dict and only 4 months to add Czech into the UD).
So what do you think? Is it really good idea to create another
English-Norwegian dictionary or lets get to work and create
nearly
50 Norwegian dictionaries at once.
Best regards
Zdenek
Tor Harald Thorland napsal(a): Hello,
Thanks for your reply. There is already a thesaurus in
production,
together with a Norwegian Bokmaal, and a Norwegian Nynorsk
spelling....
What we want to do is short described in: 1. To have the
dictionary
proof, to remove misspellings. 2. To give the user a program with
the option to send us the word not included in the dictionary,
for
the translators to translate. 3. Give a update of the dictionary
program everyday. 4. To get better quality, as using a thesaurus
for translating doesn't always give you the best/most suitable
words. 5. We want to supply a 100% Free & open source
dictionary &
a program for getting/supplying the words.
Also, the proofreading / adding of words is done on a daily
basis,
the same way as we do it on our other projects.
That is the reason, why I ask what type of licence there is on
the
dictionary.... and how available it is.
About the time perspective.. This is a everlasting project, just
as
the other lists we are running.
Brgds Tor Harald Thorland
Hello
It is great that you care about your language.
Instead of
creating another English-Norwegian dictionary I
suggest
creating something much more important than that.
Norwegian
needs a thesaurus and a lot of dictionaries. We have
developed a system which combines these two things.
Universal
dictionary connects a language with all other
languages in
the system and its entries are synonyms (so it is
also a
thesaurus). Are you really interested in creating
something
useful for all Norwegian users? How much time are
you
prepared to spend achieving this goal?
Best regards
Zdenek Broz / Dicts.info
------------------------------- Hello, My name is
Tor Harald
Thorland.
I'm currently looking into getting a better
norwegian-english-norwegian dictionary.
I wonder, the dictionary wich is in use on this
site, is it a
collection from various places? Do you store the
whole
dictionary?
What I want to do is running a service like
no.speling.org
They have a database with the words, and it is sent
out to
translators/proofreaders. In that way, you'll get a
very good
list of words.
The reason why i'm sending this mail is that it is too bad
to start translating from scratch again to get a good
dictionary.
This project will be totaly open source & free,
and will also
include a application for requesting words for
translation,
and a way to submit words wich are not translated.
Brgds. Tor Harald
-----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.2.2 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org
iD8DBQFEmWnbhq1MDwOKNrYRAuBrAJwPNRxM6LDq/ktJ/yP2en4qIIY05gCfV++E
9xmx2gaXpSVVis+0nW+kPnw= =29hf -----END PGP SIGNATURE-----
Axel Bojer
2006-06-21 20:54:37 UTC
Permalink
Post by Tor Harald Thorland
Hei,
- - De har brukt freedict sin ordliste for å oppdatere sin egen,og den
inneholder som de sier a few thousand words
- - De blander lister, ved hjelp av synonymer, andre språks lister
osv... Hvis en følger linken som ble sendt i den siste mailen jeg
mottok: http://xdxf.revdanica.com/down/ Hvis du velger fra engelsk,
til norsk, får du opp 2 ordlister, på disse er den en copyright, og
http://www.freelang.net/dictionary/norwegian.html
og som dere ser... oppdatert sist dec 2002
(...)

Fra sida du nevner:
The program is the original work of Tom van der Meijden and Frits van
Zanten.
Har du prøvd å skrive til dem og spørre dem om de vil la deg/oss
redistribuere ordlista under GPL?

Hvis ikke tror jeg jeg er enig med deg i at det er ebdre åp starte på
bunnen av heller enn å binde seg til tvilsomme lisenser og avtaler.
Når vi først bidrar bør vi være sikre på at dette er et produkt som
tilhører alle som bidrar opg at alle kan dra nytte av det sli vi selv
vil, det er det GPL er til for.

Hvis bare bokmåls- og nynorskordboka hadde vært fritt tilgjengelig så
kunne vi hatt et godt utganspunkt. Gamle engelske ordbøker kunne vel
brukes til den engelske databasen (merriam-webster? - et skudd i blinde :-)
Så vil jobben bestå i å knytte rett engelsk ord til rett norsk ord. Men
mulig jeg er på ville veier, og det ville vært minst like mye jobb som å
lage hver oppføring helt fra null.

Mvh Axel
Tor Harald Thorland
2006-06-21 21:15:22 UTC
Permalink
Post by Tor Harald Thorland
Hei,
- - De har brukt freedict sin ordliste for å oppdatere sin
egen,og den inneholder som de sier a few thousand words - - De
blander lister, ved hjelp av synonymer, andre språks lister
osv... Hvis en følger linken som ble sendt i den siste mailen jeg
mottok: http://xdxf.revdanica.com/down/ Hvis du velger fra
engelsk, til norsk, får du opp 2 ordlister, på disse er den en
copyright, og ved å gå til nettsiden til copyrighten, kommer du
hit: http://www.freelang.net/dictionary/norwegian.html og som
dere ser... oppdatert sist dec 2002
(...)
Fra sida du nevner: The program is the original work of Tom van der
Meijden and Frits van Zanten. Har du prøvd å skrive til dem og
spørre dem om de vil la deg/oss redistribuere ordlista under GPL?
Det står også som sitert under.. så, det er kun programmet som er...
Men, jeg har sendt de en mail, så en får vente å se hva som skjer derfra..
The lists of words are the property of their authors, they are not in
the public domain.
Hvis ikke tror jeg jeg er enig med deg i at det er ebdre åp starte
på bunnen av heller enn å binde seg til tvilsomme lisenser og
avtaler. Når vi først bidrar bør vi være sikre på at dette er et
produkt som tilhører alle som bidrar opg at alle kan dra nytte av
det sli vi selv vil, det er det GPL er til for.
Helt riktig, det er eneste grunnen til å dra igang noe slikt.
Hvis bare bokmåls- og nynorskordboka hadde vært fritt tilgjengelig
så kunne vi hatt et godt utganspunkt. Gamle engelske ordbøker kunne
vel brukes til den engelske databasen (merriam-webster? - et skudd
i blinde :-)
Nei, ikke et skudd i blinde, Alt skal sjekkes:-)
Så vil jobben bestå i å knytte rett engelsk ord til rett norsk ord.
Men mulig jeg er på ville veier, og det ville vært minst like mye
jobb som å lage hver oppføring helt fra null.
Det blir nok mye jobb i å knytte sammen... men alt er mulig....
Jeg vandrer ihvertfall rundt, og prøver å få tak i ting som kan taes
opp til vurdering. Har bl.a. vært i kontakt med "Launchpad/Rosetta"
for å få tak i "tekniske" ord som kan sjekkes... det er ikke mulig pr.
dags. dato, men kommer til å bli det.

Så, hold ører og øyne åpne, og kom med flere inspill, så skal vi nok
få til en ganske god ordbok etter hvert.

Tor Harald
Mvh Axel
_______________________________________________ i18n-no mailing
https://lister.ping.uio.no/mailman/lister.ping.uio.no/listinfo/i18n-no
Tor Harald Thorland
2006-06-22 14:35:16 UTC
Permalink
Hei,

Her kommer mer info:

Freelang ga følgende svar på spørsmålet om å bruke deres ordliste for
videreføring:

It's legal if you modify it so that the new list can be copyrighted
to you and not copyrighted to us anymore. For more information please
read our copyright notice:
http://www.freelang.net/dictionary/dic-copyrights.html




I tilleg, har jeg kladdet ned noen ord på følgende nettsted:
http://www.strigen.com/dict/

:-) Så igjen, «meld dere på» diskusjonen.

Hilsen
Tor Harald

Loading...