查找的信息提取与使用
汉语名词和英语名词对应:
转换:转换
连接:连接
连接:连接
缓存:缓存
一、查找功能
获取相关值:例如,基于id查找名称
执行计算,例如,得到计算公式的结果。
更新慢更改维度:确定是否根据查找条件插入或更新记录
二、理性的查找与平面文件的查找
查找的源可以是关系数据库或平面文件中的表。对于关系表,可以从源或目标中选择,也可以通过导入向导与和平文件进行相同的操作。
三、连接查询和连接查询
Informatica的转换可分为连接和非连接的两种类型。
所谓连接转换就是在整个ETL数据流中进行转换,它的输入直接来自另一个转换而不是连接。它独立于主数据流,并通过转换中的其他表达式获取输入数据。
连接查找转换将处理数据流中的每个数据,并输出不符合查找条件的预先指定的默认值,并更新动态缓存。输出值是所有输出查找端口。可以使用静态或动态缓存。
非关联查找转换只处理符合查找条件的数据,只返回一个值。对于不符合的输出null。不连接查找转换可以多次调用。输出值位于唯一返回端口。静态缓存只能使用。
四、缓存
Informatica使用缓存机制查找。服务器的缓存处理流程如下:
当第一个数据启动时,服务器在内存中构建缓存,缓存的大小由查找转换的一些属性决定。查找条件设置索引缓存,输出值放在数据缓存中。
如果内存缓存不足,则将溢出缓存放入文件中。会话结束后,除非查找缓存设置为永久性,否则缓存将被清除。
对于静态缓存,不允许更新查找转换。如果发现缓存的值不符合条件,则可以在查找中插入或更新动态缓存。
当然,您也可以选择不使用任何缓存。
五、查找传输组件
查找有5个组成部分,即在查找转换右键,并选择编辑后你看到的5个选项卡页。事实上,基本上所有的公司的转变几乎是5分。
第一次转型,第二端口选项卡和第五元数据的扩展标签几乎是相同的。只有查找的港口是除了平时的我(输入),输出(输出),和L(查找),R(返回)。回港只能有一个,而不能直接连接其他转换,只能通过LKP:表达式。
指定查找的第四条件选项卡的条件实际上是为两个表设置关联条件。
第三个属性是最重要的。SQL可以在这里重写,从查找的定义,设置返回到多个记录时,合格的方式,是否使用动态缓存,以及缓存的大小的方式。
六,查找提示
在查找条件列上创建索引
尽可能多地使用条件。如果你有不止一个条件,试着把条件放在你前面。
对于小表,尽可能使用缓存,并设置缓存大小,以便整个表可以缓存到内存中。
如果查找表和源表在同一数据库中,并且缓存不够大,请尝试使用连接而不是查找。
对于静态查找,尝试使用永久缓存(持久缓存),以便可以重用多个会话。