hive中split函数相关总结

目录

  • split函数
  • 示例
  • 实战
  • 注意事项

    split 函数一直再用,居然发现没有总结,遂补充一下;

    split函数

    在Hive中,split函数用于将一个字符串根据指定的分隔符进行分割,并返回一个数组。它的语法如下:

    split(str, pat)
    

    示例

    假设有一个包含逗号分隔的字符串"apple,banana,orange",我们可以使用split函数按逗号分割这个字符串,并返回一个包含"apple"、"banana"和"orange"的数组:

    SELECT split('apple,banana,orange', ',');
    

    实战

    select  
    	imei
    	,split(content_id,'\\_')[0] as source
    	,sum(play_cnt ) as play_cnt
    from  table_1
    grouo by imei,split(content_id,'\\_')[0]
    

    注意事项

    1.split 分割后是形成一个数组,如果取第一个值,这个和取数组第一个值是类似的,取下标,所以第一个值的下标为0;

    2.与截取函数比较substr从第1位截取到10位,是substr(contend_id,1,10),这个是从1开始的,需要区别开;

    3.当涉及稍微复杂的例子时,我们可以考虑使用split函数来处理包含更多分隔符的字符串,并结合LATERAL VIEW和explode函数来展开数组;

    比如以下例子:

    SELECT id, prop
    FROM table1
    LATERAL VIEW explode(split(properties, ',')) propTable AS prop;
    

    4.切割时,当逗号作为分隔符时,保持不变,其他多数时候要加转义,如split(properties,‘\_’),split(properties,‘,’)