大千世界的各种路名的各种说法(完)

入得谷来,祸福自求。
Post Reply
Elysees
Posts: 6758
Joined: 2003-12-05 13:10

大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-11-21 14:15

好久不来了,在公司和家两头跑,摸鱼的时间也都拿来看小白文了——最近看了个150万字的小白文(你真是够了你!),晚上拿手机刷刷恶人谷,都没工夫写贴回帖了。
来说个行业虱子,呃,大概勉强算得上行业虱子的段子吧。
话说我们的车载客户,今年又有了新要求,就是打算让用户们能够更flexible的用语音搜索街名。例如一条街,叫作N. 1st Street NW (这种街名Jun在DC一定比较常见),当然我们不能期待用户能完整的记下这么艹蛋的名字,很多用户,大概就打算说,N 1st, 或者,1st Street NW, 或者,1st NW,等等等等。总之嘛,大千世界无数人口,这名字可以任意组合一下被人说出来,既然有这种被部分说出来的可能,用户就要求,就要允许部分说出来的街名能够被搜索到。
注意,这里说的是语音搜索。
这种fuzzy match在touch screen上并不算特别困难,整个string中任何一部分被输入了,就能被找到,这个是目前几乎所有的导航都能做到的。
但是,语音,是另外一件事。
首先一点,语音的数据,并不完全。
先简单讲讲语音搜索(我也只知道个大概),在数据里,每个街名(或者POI或者城市州国家等等等),除了有名字,语音也对应了一个长长的乱码一样的字符串来记录这个词在不同语言下的发音(例如在我们收到的供应商的语音数据里,Minnesota的语音,在西班牙语里的发音里写出来是“mi|ne|"so|ta”,在英语里的发音写出来是“%mI|nI|*"so|t@”),语音引擎可以读入这个字符串转化成发音,这个发音,可以用来给出导航指示。或者,在用户说一个语音的时候,语音引擎会把这个听到的语音进行分析,也转化成这种乱码一样的字符串,在数据库中进行匹配,然后在屏幕上显示匹配的结果。
——是不是写得太罗嗦了?这么简单的问题写那么多行,好像很蠢的感觉。
然后说说我们拿到的数据。
我们每拿到一条街名,对应的,这个街名会被切分成若干分保存,一个完整的街名(N 1st Street NW),一个base街名(1st),一个街的类型(Street),一个prefix(N.),一个Suffix(NW),相应的,语音数据也有几种:完整街名的语音,Base的语音,街类型的语音,Prefix的语音,以及,Suffix的语音;后面这三个是单独的三个表,因为这三种成分是——供应商认为——普适的。
那么简单的方法就是把这些语音排列组合的加在一起,拼成各种可能的街名的说法,N 1st,就把Prefix+Base的语音加在一起,1st NW,就是把Base和Suffix的语音加一起。
于是第一个问题来了,这些语音Prefix,街型和Suffix的发音,并不是普适的。虽然我们认为N.在哪里都发North的音,在数据里,很显然,并不是如此,显然North在有些词前面,发一种音,在另一些词前面的时候,发另外一种音。同理可以推广到街型和Suffix,于是这三个普适的表格,不足够我们所用。
更大的问题是——这个小美大概一看开头就拍大腿说不行了?——,在有些语言里面,例如德语法语西班牙语等等语,两个词连在一起的说法,和两个词分开以后的语音相加,完全不是一回事儿。
于是我们又找公司里的法语和德语支持来开会,问他们在德国法国的街名情况。
两个人都坚定地回答,在德国/法国,没有prefix/suffix这些东西,一条街名就是一条街名,人们或者说Avenue Des Champs-Elysees(噢对,在法语里,街的类型又跑Base前面去了),或者说Champs-Elysee,没了。
德语支持说得更有意思,她说她们那里的街名,不一定是什么什么街,有可能是一个landmark,例如某个地方若干年前有条小溪,人家那街名就叫beim stillen bach,不仅没有prefix/suffix,连type都没有了!还可能某地方几月几日打过一场仗,就给那里的街名命名为几月几日了。
我百思不得其解,于是问,那,那个什么Beim Stillen Bach,街型算是Beim吗?德国姑娘说不是,这就是街名,当然,这个街名我们是从来不说的,我们给人说走某街的时候,说的是Stiller Bach。。。
法国小哥还振振有词的说,我们的街名,那都是几百年几百年流传下来的,并不像美国这样,我们给这些街取名的时候,都还没有东南西北之类的概念。
我沉思一秒,立即反驳道,这不可能,别说几百年前,中国上千年的街名,也是有东南西北的。美国大叔立即支持我,说,对阿,你们的北京,北不就是North的意思嘛,意思是北边的城市?
我还沉浸在古时候街名的回忆中,在想,东西南北这些方向词,在我们历史长河里,到底有没有出现在街名里过呢。——当然,方向,那是一定有的,东西南北自古有之,随便搜篇徐霞客游记都能被他满篇满篇的方向词绕晕(这人就是个活丈量地图阿!)。我们一直说的青龙白虎朱雀玄武,也是基于东南西北的,显然不是没有,只是有没有在街名里而已。
我深觉这简直是可以拿来写篇历史地理论文的体裁,不过当然这不是我们开会的重点,重点是,欧洲的街名里没有Prefix和Suffix,人们说一条街,或者说整个街名,或者只说Base,简单明快又方便,更重要的是,数据里有现成的语音,我们不用自己瞎拼了!
会议圆满结束,皆大欢喜。
我乐滋滋想,这好像是第一次,欧洲的情形比美国要简单呢。
等下,可是,中国呢?
我跟上海同事聊天,问道,那么淮海南路,这个南,到底是路名base的一部分,还是Suffix呢?——如果是Suffix,那这个suffix,又跑到Base和街型之间了。那么,会不会有人在找街名的时候,说淮海南来找这条街?
因为中国数据我们没法查到,于是不了了之,同事挥挥手说,别管中国了,反正不是我们做,算了算了。
于是欢喜结束。
我们只要把英语街名,准确的说,美国的英语街名这骨头啃下来,就好了。
我自横刀向天笑,笑完我就去睡觉。

CAVA
Posts: 8169
Joined: 2003-12-06 16:55

Re: 大千世界的各种路名的各种说法(完)

Post by CAVA » 2013-11-22 5:51

好有趣好复杂啊。

这个欧洲的路名我怎么感觉没那么绝对没有前缀和后缀呢?拿伦敦来说,Sherlock拍摄的地点在North Gower Street, 以别于Gower Street;美国大使馆在South Audley Street,北边同一条路叫North Audley Street。更有不少地址里带upper, lower之类的前缀。

上海人一般讲什么什么路,淮海路南京路,不带后缀,只有认真找地址,才会说淮海中路淮海西路,陕西北路陕西南路。

Knowing
Posts: 34487
Joined: 2003-11-22 20:37

Re: 大千世界的各种路名的各种说法(完)

Post by Knowing » 2013-11-22 6:04

好玩。
伦敦路名这叫一个乱,不但有upper lower ,最烦人的是同一个名字某某,会有某某street,某某place, 某某Court, 某某Place, 某某Close , 某某court, 某某Crescent, 某某 Terrace,还经常都不在一起!幸好他们邮编比较发达详细,只要有邮编定位就准确了,不然找死。
有事找我请发站内消息

CAVA
Posts: 8169
Joined: 2003-12-06 16:55

Re: 大千世界的各种路名的各种说法(完)

Post by CAVA » 2013-11-22 6:10

对啊对啊,还有某某Square,某某Avenue,绝对是旅行陷阱。

tiffany
Posts: 24708
Joined: 2003-11-22 20:59

Re: 大千世界的各种路名的各种说法(完)

Post by tiffany » 2013-11-22 9:26

:BloodyK: :BloodyK:
乡音无改鬓毛衰

Jun
Posts: 27816
Joined: 2003-12-15 11:43

Re: 大千世界的各种路名的各种说法(完)

Post by Jun » 2013-11-22 9:35

别管英国了,反正不是我们做,算了算了。 :mrgreen:
此喵已死,有事烧纸

幻儿
Posts: 1636
Joined: 2007-07-31 10:47

Re: 大千世界的各种路名的各种说法(完)

Post by 幻儿 » 2013-11-22 10:56

Elysees wrote:摸鱼的时间也都拿来看小白文了——最近看了个150万字的小白文(你真是够了你!
什么小白文?

Elysees
Posts: 6758
Joined: 2003-12-05 13:10

Re: 大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-11-22 12:40

Knowing wrote:好玩。
伦敦路名这叫一个乱,不但有upper lower ,最烦人的是同一个名字某某,会有某某street,某某place, 某某Court, 某某Place, 某某Close , 某某court, 某某Crescent, 某某 Terrace,还经常都不在一起!幸好他们邮编比较发达详细,只要有邮编定位就准确了,不然找死。
小k说这个在美国有些城市也蛮常见的,Telegraph St, Telegraph Ct, Telegragh Place这种东西还蛮多的,他们就是Base name一样,street type差得很远。所以用户如果输Telegraph,那能拿到的选项可能会很多。
既然说到这个,我们以前还讨论过,有些街名非常普适,几乎每个城市都有的,Main St(不是Main Ave),Front St, Telegraph St, Park Ave,之类之类的,大概相当于咱们中国的人民路。
我昨晚回去还跟贵人聊天说起来,问他西安城里有什么很老的街名,他想也不想就说,那每个街名都很老,我就说怎可能,陕西路这种绝对不是旧路名啊。我们全家一起想了很久,觉得长安街(东西长安街)应该是条旧的路名?可能还有平安大道,西安以前贵人奶奶住的地方叫半截巷,这个倒很有古意;北大小南门出去的路好像叫军机处胡同(?我不是特别肯定),北大的西门地址实际是娄斗桥1号。这么说起来,其实中国旧些的路名也不少是POI——娄斗桥就是个例子。那个时候只有路没有门牌号——什么时候开始有的邮差?——所以路型有没有无所谓?所有的路名其实也就是个指路用的标示而已。

Cava说的拿陕西路找陕西南路,肯定很常见吧,起码我作为外地人是对这个什么南北没有概念的——不过数据里这两个理论上说不是一条路。比较有意思的是,这个Suffix不是像英语似的在type后面,而是在type和base中间。中国还有个颇别致的地方(可能欧洲也有?),就是地址和路名不一定match,例如,陕西南路上有个房子,前面是陕西南路70号,后面是陕西南路90号,但这个中间的房子,可能会叫西安路50号(这是个捏造的例子哈,大概是这么个意思,或者类似于北京很多楼地址其实叫什么什么小区**号,根本对不上他们在的那条街),这对我们geocoding简直是个噩梦,但中国的地址有时候就是那么古怪,说起来也有一小篇呢。
我自横刀向天笑,笑完我就去睡觉。

Elysees
Posts: 6758
Joined: 2003-12-05 13:10

Re: 大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-11-22 12:49

Jun wrote:别管英国了,反正不是我们做,算了算了。 :mrgreen:
我抱头说,英国倒是我们做,不过,大概在供应商的欧洲支持眼里,英国不算欧洲,因为用英语,使用美国的规矩?——恩,不对,我们这个技术支持就在英国阿。
英国邮编确实还挺细。我听我们那边的技术支持说,还有拿短邮编当城市来找的(因为邮编好算一个build-up area,所以他们就算一个admin level),所以我们的touch screen里面,邮编还作为城市的候选出现。我记得当时问他的时候,他给我发了这么个照片
Image
我自横刀向天笑,笑完我就去睡觉。

Elysees
Posts: 6758
Joined: 2003-12-05 13:10

Re: 大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-11-22 12:50

幻儿 wrote:
Elysees wrote:摸鱼的时间也都拿来看小白文了——最近看了个150万字的小白文(你真是够了你!
什么小白文?
这个。。。。。。我看的小白文,没有女主角的,你还要知道吗?
我自横刀向天笑,笑完我就去睡觉。

豪情
Posts: 21256
Joined: 2003-11-22 18:47

Re: 大千世界的各种路名的各种说法(完)

Post by 豪情 » 2013-11-22 12:50

法国小哥还振振有词的说,我们的街名,那都是几百年几百年流传下来的,并不像美国这样,我们给这些街取名的时候,都还没有东南西北之类的概念。
:mrgreen:
法国是我见过的最没有东南西北概念的国家了。法国的地图和路标也极度噩梦。这个是文化差异,不是历史长久的问题。
谁道闲情抛掷久?每到春来,惆怅还依旧。

CAVA
Posts: 8169
Joined: 2003-12-06 16:55

Re: 大千世界的各种路名的各种说法(完)

Post by CAVA » 2013-11-22 12:53

真的写起路名来一定特别有意思。我随便猜猜,最早大概以行业命名,北京旧皇城周围多的是这些,近代路多了,开始用名人,地名,还有概念(人民路解放路之类的)。

小E你们公司谁做日本地名一定也得捉摸当地特色,錦小路柳馬場西入,祇園町南側570-128这种地名,和中国的格式又不一样。

Elysees
Posts: 6758
Joined: 2003-12-05 13:10

Re: 大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-11-22 12:57

我老生常谈的跳出来说,一个城市的建成,连同他们的街名(如果能被保留下来的话),到处有这个城市历史形成过程的痕迹,法国这种乱七八糟的路名和乱七八糟的方向,肯定跟他们那时候城市形成的时候各自圈地,然后圈地以后地主胡乱给个名字有关。。。。。。吧?还有什么辐射形的路,这种就是马车时代的印记。。。。大概?
我自横刀向天笑,笑完我就去睡觉。

Elysees
Posts: 6758
Joined: 2003-12-05 13:10

Re: 大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-11-22 13:00

CAVA wrote:真的写起路名来一定特别有意思。我随便猜猜,最早大概以行业命名,北京旧皇城周围多的是这些,近代路多了,开始用名人,地名,还有概念(人民路解放路之类的)。

小E你们公司谁做日本地名一定也得捉摸当地特色,錦小路柳馬場西入,祇園町南側570-128这种地名,和中国的格式又不一样。
我们一直避着日本走,全球market连玻利维亚这种小国家都有,唯独没有日本。主要原因是日本比较排外,外面的汽车行业进不去,他们本地的导航因为有local knowledge也做得很好,我们插不进去。——就连NAVTEQ这种全球数据供应商,日本的数据也是空白。
不过最近公司打算搞个base product做市场,似乎要包括日本市场,正在研究日本当地的数据供应商,如果真做到了,我又还在干,一定上来跟你们扔虱子。
我自横刀向天笑,笑完我就去睡觉。

幻儿
Posts: 1636
Joined: 2007-07-31 10:47

Re: 大千世界的各种路名的各种说法(完)

Post by 幻儿 » 2013-11-22 13:14

Elysees wrote:
幻儿 wrote:
Elysees wrote:摸鱼的时间也都拿来看小白文了——最近看了个150万字的小白文(你真是够了你!
什么小白文?
这个。。。。。。我看的小白文,没有女主角的,你还要知道吗?
哦,那就不用了。。。 :mrgreen:

tiffany
Posts: 24708
Joined: 2003-11-22 20:59

Re: 大千世界的各种路名的各种说法(完)

Post by tiffany » 2013-11-22 13:20

那个,还有broadway, 一个小town要是有两条街,一条街叫main,另一条是broadway. :mrgreen:
乡音无改鬓毛衰

tiffany
Posts: 24708
Joined: 2003-11-22 20:59

Re: 大千世界的各种路名的各种说法(完)

Post by tiffany » 2013-11-22 13:21

另,小白文有几个男主角? :mrgreen:
乡音无改鬓毛衰

Elysees
Posts: 6758
Joined: 2003-12-05 13:10

Re: 大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-11-22 13:26

tiffany wrote:另,小白文有几个男主角? :mrgreen:
呃,主角的话,可能只能算2个吧,不过还有4个副主角,还有若干若干的配角,全都是男的!女配角也有几个,不过没有感情戏。
我自横刀向天笑,笑完我就去睡觉。

tiffany
Posts: 24708
Joined: 2003-11-22 20:59

Re: 大千世界的各种路名的各种说法(完)

Post by tiffany » 2013-11-22 13:27

哦,这种人人都同志的小说我不是很爱看.... :mrgreen:
乡音无改鬓毛衰

Jun
Posts: 27816
Joined: 2003-12-15 11:43

Re: 大千世界的各种路名的各种说法(完)

Post by Jun » 2013-11-22 16:25

遥远地回答小E,英国一般不算欧洲,因为它是脱离欧陆的孤岛。英国自己也不怎么认同自己是 "the continent" 的一部分,除了经常跟法国打一架。
此喵已死,有事烧纸

笑嘻嘻
Posts: 23308
Joined: 2003-11-22 18:00

Re: 大千世界的各种路名的各种说法(完)

Post by 笑嘻嘻 » 2013-11-23 1:16

中国的“皇城”大概都比较东南西北地横平竖直。北京就极其标准。有条不那么指方向的街,干脆叫“斜街”了。北京人说话多用东南西北。有个笑话是说有个老太太嫌床挤,推推自家老头说:“你往南边去去。”上海街道就弯得不亦乐乎。我见过最有古意的路名都是在苏州,而且大量的路名都很古。
云浆未饮结成冰

Jun
Posts: 27816
Joined: 2003-12-15 11:43

Re: 大千世界的各种路名的各种说法(完)

Post by Jun » 2013-11-23 22:02

好像是美国街名随英国,啥啥street。法文里就是avenue啥啥。
此喵已死,有事烧纸

Knowing
Posts: 34487
Joined: 2003-11-22 20:37

Re: 大千世界的各种路名的各种说法(完)

Post by Knowing » 2013-11-24 14:07

北京的老路名,胡同那些,都自带着找路的指示。比如我妈说她小时候住南锣鼓巷雨儿胡同,我一直不明白到底是南锣鼓巷还是雨儿胡同,这次去北京逛南锣鼓巷夜市,发现就是先找到南锣鼓巷,才能顺着一条条胡同找到雨儿胡同。
有事找我请发站内消息

Elysees
Posts: 6758
Joined: 2003-12-05 13:10

Re: 大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-12-02 19:04

CAVA wrote: 这个欧洲的路名我怎么感觉没那么绝对没有前缀和后缀呢?拿伦敦来说,Sherlock拍摄的地点在North Gower Street, 以别于Gower Street;美国大使馆在South Audley Street,北边同一条路叫North Audley Street。更有不少地址里带upper, lower之类的前缀。
我们的英国local支持回信袅,说
As mentioned, there are no Prefixes nor Suffixes in Europe – so not just France and Germany, but all countries. This means the values listed below (E, N, NE, etc) are never published as a separate value in the prefix or suffix field – this is because they are not present in Europe.
还有关于CAVA给的街名的解释
If a road name begins with a direction (i.e., North, South, East, etc.) that is not related to addressing, the direction is not included as a prefix. Rather, the direction is spelled out in the Base Name field. For example, in “North Carolina Blvd”, “North” is part of the road name (the name of the state of North Carolina) and not a prefix.
所以我猜测的是,North Grower Street和Grower Street,应该位置上跟Grower Street没啥关系,或者跟South Grower Street没啥绝对的南北关系?
我们这边说的N. S的Prefix,往往是指代一条街的两个方向,例如W. El Camino Real和E. El Camino Real是一条街,但东西相连,从某一个intersection开始,一边是E一边是W。
我自横刀向天笑,笑完我就去睡觉。

CAVA
Posts: 8169
Joined: 2003-12-06 16:55

Re: 大千世界的各种路名的各种说法(完)

Post by CAVA » 2013-12-03 3:11

如果定义是只有同一条路分了南北东西才叫前缀,那么英国中国的路名果然没有前缀后缀,因为North Gower Street和Gower Street是两条不同的路,哪怕两者在同一条直线上,而前者的确在后者的北面。依此类推东长安街和西长安街也是两条路?

其实只要行业公认了定义,大家能照着做产品就好了。没有哪条定律能涵盖100%的路名罢?

Elysees
Posts: 6758
Joined: 2003-12-05 13:10

Re: 大千世界的各种路名的各种说法(完)

Post by Elysees » 2013-12-03 14:04

哎,CAVA说得对,这个玩意儿吧,也就是自己定义,主要是为了尽量规范的capture数据呗。
所以我说呢,导航这种活儿,那么localized,其实很不好一个地方搞全球市场呢,我还跟我们pm开玩笑说,要想尽量做得好,先得把我们送那儿去住个半年,了解下当地习惯不是。
我自横刀向天笑,笑完我就去睡觉。

Post Reply